一 言 


不 同 于 磁带 、 机 械 硬 盘 、 光 盘 等 依托 机 械 运 动 实现 读 写 的 存储 技术 ， 固 态 存 储 器 (solid-state memory， 简 称 固态 存储 ) 完全 基于 半导体 技术 ， 通 过 改变 
芯片 内 部 固态 存储 介质 的 状态 (比如 电荷 、 相 变 、 极 化 和 电阻 等 ) 来 存储 数据 。 在 传统 磁盘 人 存储 系统 性 能 停滞 不 前 的 情况 下 ， 固 态 人 存储 以 狐 新 的 视角 ， 经 过 多 
年 的 研究 和 发 展 ， 为 存储 领域 带 来 了 一 场 革命 性 变革 ， 成 为 突破 现 有 存储 性 能 瓶颈 的 希望 。 然 而 ， 随 着 固态 存储 的 应 用 和 普及 ， 数 据 存 储 安全 性 、 机 密 性 、 可 
靠 性 等 问题 逐渐 凸显 。 如 何 解决 固态 存储 架构 中 存在 的 安全 问题 将 是 本 书 中 的 浓墨重彩 之 处 。 


全 书 共 11 章 ， 可 分 为 三 部 分 : 第 一 部 分 包括 第 1~3 章 ,介绍 存储 技术 的 基础 知识 。 第 1 章 简 要 回顾 了 存储 技术 的 友 展 历史 ， 介绍 了 当前 主流 存储 介质 的 工 
作 原 理 和 特点 ， 随 后 对 磁盘 阵列 、 网 络 化 存储 和 大 数据 时 代 下 的 新 兴 存 储 技术 进行 了 介绍 ， 最 后 简介 了 存储 系统 的 逻辑 构成 。 第 2 章 对 当前 主要 文件 系统 ， 如 
FAT、EXT、NTFS、CDFS， 从 基本 概念 、 存 储 结构 、 和 存储 特点 等 方面 作 了 详细 的 阐述 并 进行 了 对 比 ， 随 后 对 其 他 一 些 文件 系统 ， 如 BtrFS、ZFS、HFS 等 进行 
了 简单 介绍 。 第 3 草 讲述 存储 系统 的 接口 与 协议 ,简单 阐述 了 接口 与 协议 的 基本 概念 ， 详 细 介 绍 了 计算 机 系统 中 常用 的 存储 器 物理 协议 和 接口 ， 并 对 各 个 接口 
和 协议 的 友 展 、 特 点 以 及 原理 进行 了 详细 的 分 析 。 


第 二 部 分 包括 第 4~7 章 ,介绍 了 固态 存储 的 原理 与 架构 。 第 4 草 对 固态 存储 技术 进行 了 概述 ， 详 细 介 绍 了 基于 NAND Flash 和 NOR Flash 的 固态 存储 原理 。 
第 5 章 以 日 常 工 作 、 生 活 中 广泛 使 用 的 固态 硬盘 (SSD) 为 例 给 出 了 固态 存储 架构 ， 并 详细 介绍 了 固态 存储 系统 各 大 基本 部 件 的 结构 、 功 能 和 原理 。 第 6 章 主要 
针对 固态 存储 设备 中 广泛 使 用 的 诅 入 式 文 件 系统 ， 如 JFFS、YAFFS、UBIFS 以 及 exFAT 等 文件 系统 ， 从 内 存 结构 、 文 件 系统 挂 载 、 运 行 原理 、 垃 圾 回收 等 方 
面 ， 详 细 介 绍 固 仿 存 储 文件 系统 的 原理 和 运行 机 制 。 第 7 章 主要 对 固态 存储 设备 中 的 容错 与 平衡 技术 进行 了 介绍 ， 首 先 介绍 了 三 种 纠 错 码 即 汉 明码 、BCH 码 以 
及 里 德 -所 罗 门 码 的 操作 原理 ， 接 着 介绍 了 固态 存储 的 平衡 机 制 ， 分 别 从 垃圾 回收 和 使 用 均衡 两 个 方面 介绍 其 作用 和 实现 原理 ， 最 后 介绍 了 固态 存储 器 件 的 坏 
块 管理 与 实现 。 


第 三 部 分 包括 第 8~11 章 ,介绍 了 固态 存储 安全 技术 及 对 前 沿 科 技 的 展望 。 第 8 章 详细 介绍 了 为 提高 固态 存储 设备 的 数据 安全 ， 学 术 界 提出 的 各 种 技术 方 
案 。 第 9 章 首先 讨论 固态 存储 设备 中 数据 加 密 的 主要 算法 XTS-AES， 随 后 简单 介绍 了 近年 来 学 术 界 提出 的 多 种 可 否认 加 密 与 可 否认 认证 协议 方案 ,然后 根据 面 
向 系统 平台 的 不 同 ， 着 重 介绍 可 人 否认 加 密 技术 在 数据 存储 方面 ， 尤 其 是 固态 存储 设备 上 的 各 种 应 用 方案 。 第 10 章 介绍 了 为 保护 存储 设备 数据 安全 ， 学 术 界 提出 
的 基于 NAND Flash 物 理 特性 ， 提 取 设 备 指纹 、 随 机 数 、 密 钥 等 信息 及 其 应 用 实例 。 第 11 章 对 存储 技术 的 友 展 作 了 展望 。 


前 3 章 内 容 较为 基础 ， 第 4~7 章 为 固态 存储 相关 基础 知识 ， 第 8~10 章 则 为 固态 存储 领域 以 及 作者 自身 团队 与 安全 相关 的 研究 成 果 ， 内 容 较 新 ， 最 后 一 章 为 
展望 ， 读 者 可 根据 自己 的 兴趣 和 时 间 情 况 选择 阅读 。 


固态 存储 友 展 极为 迅速 ， 目 前 已 成 为 一 个 新 兴 热 点 领域 。 云 计算 、 物 联网 、 大 数据 时 代 的 到 来 ， 为 存储 技术 的 创新 市 来 了 新 的 机 遇 和 挑战 。 随 着 新 型 国人 态 
存储 介质 的 日 渐 成 熟 ， 延 时 越 来 越 低 ， 珊 宽 越 来 越 高 ， 以 动态 随机 存储 器 为 代表 的 易 失 型 存储 设备 在 主 存 中 的 垄断 地 位 将 可 能 被 非 易 失 型 固态 存储 设备 所 取 
代 。 而 不 断 增 大 的 容量 和 不 断 降低 的 价格 ,使 固态 存储 技术 越 来 越 适合 于 构建 高 性 能 的 外 部 存储 设备 。 以 磁盘 为 代表 的 机 械 驱 动 外 部 存储 设备 的 主流 地 位 将 逐 
步 被 固态 存储 设备 取代 ， 使 得 存储 系统 的 访问 模式 可 能 转 为 利用 电子 设备 的 电气 特性 而 非 机 械 转动 。 轧 之， 固态 存储 已 成 为 数据 存储 发 展 的 必然 趋势 ， 其 安全 
性 、 机 密 性 、 可 靠 性 等 值得 关注 。 


本 书 的 研究 工作 得 到 国家 重点 基础 研究 发 展 计 划 (973 计 划 ) 2013CB338001 课 题 的 支持 。 在 本 书 的 编写 和 出 版 过 程 中 ， 得 到 了 机 械 工业 出 版 社 的 大 力 支 
持 ， 在 此 谨 表 诚挚 的 谢意 。 


由 于 作者 水 平 有 限 ， 加 之 固态 存储 技术 友 展 迅速 ， 书 中 不 有 和 错误 之 处 在 所 难免 ， 诚 奶 地 和 希望 专家 和 读者 提出 宝贵 意见 ， 以 帮助 本 书 改进 和 完善 。 


第 一 部 分 “” 仔 储 扩 术 基础 


. 第 1 章 ”存储 技术 概要 
第 2 章 文件 系统 
. 第 3 章 ”接口 与 协议 


信息 技术 的 日 新 月 异 使 社会 对 信息 存储 的 需求 逐日 攀升 ， 同 时 借 力 于 大 数据 分 析 ， 信 息 存 储 为 社会 带 来 的 价值 也 日 益 增 大 。 作 为 信息 管理 的 基石 ， 信 息 存 
储 技术 已 经 发 展 成 为 一 门 既 复杂 又 成 熟 的 分 支 学 科 ， 它 需要 满足 信息 管理 的 高 性 能 、 可 扩展 、 可 共享 、 高 可 用 、 自 适应 和 可 管理 等 一 系列 需求 ， 是 一 门 非常 关 
键 的 技术 。 


数据 存储 是 人 们 一 直 以 来 都 在 应 用 并 且 探 索 的 主题 。 在 原始 社会 ， 人 们 用 树枝 和 石头 来 记录 数据 。 后 来 ， 人 们 用 铁器 在 石头 上 刻画 一 些 象形 文字 来 记录 数 
据 ， 但 此 时 记录 的 内 容 也 只 有 自己 能 看 得 懂 。 再 后 来 ， 随 着 语言 、 文 字 、 造 纸 、 印 刷 等 技术 的 出 现 ， 信 息 得 到 了 更 加 长 久 地 存储 。 而 随 着 科学 技术 的 发 展 ， 纸 
带 、 软 盘 、 硬 盘 、 光 盘 等 成 为 主要 的 存储 介质 。 


本 书 第 一 部 分 描述 了 与 存储 技术 有 关 的 基础 知识 ， 包 括 第 1~3 章 的 内 容 。 


第 1 章 介 绍 了 存储 技术 的 基本 概念 ， 回 顾 了 信息 存储 技术 的 发 展 历程 ， 简 单 介 绍 了 目前 主流 的 物理 存储 介质 ， 如 磁 介 质 、 光 介质 以 及 半导体 存储 器 ， 并 分 
析 其 基本 组 成 和 工作 原理 ， 以 及 各 自 的 特点 ， 并 对 磁盘 阵列 技术 进行 了 介绍 。 同 时 也 介绍 了 当前 主流 的 网 络 存 储 技 术 和 分 布 式 存储 技术 的 相关 概念 、 原 理 、 特 
点 等 内 容 ， 论 述 了 其 基本 体系 和 组 成 。 最 后 对 存储 系统 的 基本 组 成 作 了 简单 介绍 。 


第 2 章 介 绍 了 一 些 主要 的 文件 系统 ， 包 括 FAT、EXT、NTFS、CDFS， 并 从 不 同文 件 系 统 的 发 展 概况 、 基 本 概念 、 存 储 结构 、 存 储 特点 等 方面 作出 详细 的 阅 
述 。 此 外 ， 还 简要 介绍 了 其 他 一 些 文 件 系 统 ， 如 BtrFS、ZFS、HFS、HFS+、ReiserFS、JFS、XFS、UFS、VMFS、VxFS、ReFS 等 ， 并 分 析 其 各 自 的 特点 。 最 后 


对 常用 的 文件 系统 进行 了 对 比 ， 讨 论 它 们 之 间 的 区 别 和 各 自 的 优 缺 点 。 


第 3 章 介 绍 了 存储 系统 的 接口 与 协议 ， 简 单 益 述 了 接口 与 协议 的 基本 概念 ， 详 细 介 绍 了 计算 机 系统 中 常用 的 存储 器 物理 协议 和 接口 ， 包 括 IDE 协 议 及 接 
口 、SCSI 协 议 及 接口 、FC 协 议 及 接口 、SATA 协 议 及 接口 、SAS 协 议 及 接口 、PCI-E 协 议 及 接口 、eMMC 协 议 及 接口 ， 并 对 各 个 接口 和 协议 的 发 展 、 特 点 以 及 原 
理 都 进行 了 详细 的 分 析 。 


第 1 草 “和 储 反 术 概要 


存储 器 作为 电子 产品 的 数据 存储 支撑 ， 在 整个 产业 中 占有 核心 地 位 。 近 几 十 年 来 ， 新 的 存储 技术 不 断 涌现 ， 推 动 了 存储 设备 的 快速 更 新 换代 。 在 20 世 纪 50 
年 代 ， 由 于 体积 庞大 ， 和 存储器 仅 能 运用 于 大 型 计算 机 ， 如 今 的 存储 器 早已 今 非 昔 比 ， 其 体积 小 、 性 能 高 、 容 量 大 ， 可 运用 于 各 个 领域 ， 成 为 开局 大 数据 时 代 的 
基石 。 本 章 首先 回顾 了 存储 技术 的 友 展 历史 ， 随 后 介绍 了 当前 的 主流 存储 技术 及 大 数据 时 代 下 出 现 的 新 型 存储 技术 ， 最 后 介绍 了 存储 系统 的 逻辑 构成 。 


1.1 存储 技术 友 展 简 史 


信息 存储 是 自古 就 有 的 话题 。 特 别 是 数字 化 信息 技术 诞生 以 来 ， 关 于 数字 信息 存储 的 技术 不 断 演进 和 发 展 ， 并 持续 得 到 学 术 界 和 工业 界 的 关注 。 


言 息 本 身 是 没有 物理 形态 的 ， 只 有 经 过 载体 的 承载 才能 进行 存储 、 传 递 和 共享 。 长 期 以 来 ， 人 们 都 在 不 断 探索 保存 信息 的 方法 和 载体 。 起 初 人 们 借助 于 不 
同 颜色 的 石头 、 在 绳 上 打 结 等 方式 来 记事 ， 这 是 信息 仓储 的 早期 方式 。 随 着 语言 、 文 字 的 出 现 ， 信 息 仓储 技术 迎 来 了 一 次 质 的 飞跃 ， 人 们 可 以 将 信息 记载 到 一 
些 载 体 上 ， 使 得 信息 能 够 长 期 有 效 地 保存 。 尤 其 是 造纸 术 的 友 明 ， 它 结束 了 人 们 利用 石 涉 、 和 竹简、 金属、 兽 骨 等 高 成 本 、 低 密度 载体 的 历史 ， 而 印刷 术 的 出 现 
则 终结 了 以 手 抄 和 篆刻 文献 为 主 的 时 代 ， 使 得 信息 能 够 大 量 记录 并 长 久保 分， 大 大 增强 了 人 类 知识 积累 的 能 力 。 


随 着 科学 技术 的 不 断 友 展 ， 社 会 信息 量 急 剧 增加 ， 信 息 的 飞速 增长 是 当今 社会 一 大 特点 。 由 于 纸张 存储 存在 体积 大 、 不 利于 查阅 和 维护 等 问题 ， 用 纸张 存 
储 信息 的 局 限 性 便 逐 渐 暴 露出 来 。 计 算 机 技术 的 出 现 和 友 展 很 好 地 解决 了 这 些 问 题 ， 而 计算 机 技术 与 现代 通信 技术 的 结合 使 信息 处 理 速度 和 存储 效率 得 到 了 惊 
人 的 提高 ， 人 类 处 理 信息 的 能 力也 得 到 了 很 大 的 友 展 。 因 此 ， 现 代 信息 存储 技术 的 友 展 与 计算 机 的 友 展 密 不 可 分 。 


目前 ， 主 流 的 信息 存储 手段 主要 是 利用 磁 介质 、 光 介质 或 半导体 介质 等 相关 技术 实现 。 早 期 的 计算 机 系统 没有 磁盘 ， 利 用 在 纸 这 上 打 孔 来 进行 数据 存储 并 
作为 输入 计算 机 系统 的 手段 。 友 明 磁 存储 技术 之 后 ， 磁 市 是 主要 的 数据 仓储 介质 ， 相 对 纸 睛 打 孔 而 言 ， 磁 市 的 读 写 速度 快 了 很 多 ， 而 且 易于 保存 。 由 于 成 本 低 
廉 ， 磁 囊 库 在 目前 一 些 网 络 存储 系统 中 仍 被 广泛 应 用 。 


进入 21 世 纪 以 后 ， 网 络 日 益 帮 达 ， 计 算 机 技术 也 不 断 进步 ， 信 息 量 更 是 成 倍 地 增长 。 为 了 应 对 海量 数据 的 人 存储， 工业 界 持续 致力 于 硬盘 容量 的 提升 ， 然 而 
在 有 些 场合 下 仍旧 无 法 满足 信息 存储 的 需要 。 在 海量 存储 需求 的 推动 下 ， 将 大 量 磁盘 连接 起 来 的 磁盘 阵列 技术 被 设计 出 来 ， 以 提供 更 大 的 存储 空间 。 磁 盘 阵 列 
一 般 部 署 在 网 络 之 中 ， 作 为 专门 提供 存储 服务 的 网 络 节 点 而 存在 。 目 前 主要 的 三 种 网 络 存 储 架 构 是 DAS、NAS、SAN。 其 中 ，DAS ( 直 连 式 存 储 ) 是 一 种 以 服 
务 器 为 中 心 的 存储 架构 ， 服 务 器 直接 通过 SCSI 接 口 与 磁盘 阵列 连接 ， 服 务 器 端的 磁盘 阵列 端口 不 能 共享 ， 客 户 端 需 向 服务 器 友 送 连接 请 求 ， 然 后 获得 由 服务 器 
转发 而 来 的 信息 。 随 着 网 络 反 术 和 光纤 技术 的 友 展 ，DAS 逐 步 被 其 他 方式 取代 。NAS (网 络 附加 存储 ) 即 通 过 直接 连接 或 外 部 连接 到 网 络 上 ， 使 得 网 内 的 信息 
处 理 设备 能 够 直接 对 其 进行 读 写 。NAS 拥 有 专门 的 文件 和 操作 系统 ， 实 现 了 文件 服务 的 优化 ， 并 且 具 有 异 构 共 享 能 力 ， 使 不 同 操作 系统 下 的 用 尸 可 以 方便 存 取 
任意 格式 的 文件 数据 。 而 SAN (存储 区 域 网 络 ) 中 ， 服 务 器 采用 专用 网 络 实 现 对 磁盘 阵列 的 读 写 ， 是 一 种 利用 光纤 集线器 、 光 纤 路 由 器 、 光 纤 交 换 机 等 网 络 互 
连 设备 将 磁盘 阵列 和 服务 器 互 连 起 来 的 面向 网 络 、 以 数据 为 中 心 的 存储 架构 。 在 SAN 模 型 中 ， 多 个 服务 器 能 够 访问 磁盘 阵列 中 的 同一 个 端口 。 


除了 容量 ， 信 息 的 存 取 速 度 是 随 着 存储 需求 的 提升 而 面临 的 男 一 个 瓶 贷 。 传 统 硬 盘 由 于 机 械 架构 的 存在 ， 其 响应 速度 的 提高 存在 限制 ， 而 目前 硬盘 的 主轴 


转速 基本 没有 太 大 的 提高 空间 了 。 硬盘 的 友 展 显然 要 落后 于 其 他 硬件 ， 并 逐渐 成 为 PC 中 的 瓶 矣 乙 一 ， 直 到 固态 硬盘 的 到 来 才 让 硬盘 真正 进入 高 速 友 展 的 时 
代 。 国 态 存 储 是 指 以 半导体 存储 器 件 为 介质 进行 数据 存储 和 读 取 的 一 种 技术 ， 早 期 的 固态 存储 技术 主要 是 基于 动态 随机 存储 器 (Dynamic Random 
Memory，DRAM) ， 但 是 由 于 其 断 电 后 存储 的 数据 束 会 消失 ， 严 重 制约 了 其 应 用 范围 。 近 年 来 基于 闪存 (Flash Memory) 的 固态 存储 技术 日 趋 成 熟 ， 并 企 
大 容量 存储 方面 友 挥 着 越 来 越 重 要 的 作用 |。 


言 息 技术 的 友 展 不 可 避免 引 友 对 信息 安全 的 关注 。 在 日 常 工 作 、 生 活 以 及 学 习 中 ， 人 们 越 来 越 依赖 信息 技术 ， 越 来 越 多 的 数据 被 存储 在 计算 机 系统 中 ， 存 
储 系统 必须 保证 这 些 数 据 的 高 可 用 性 和 高 安全 性 。 随 着 存储 系统 由 本 地 直 连 向 着 网 络 化 和 分 布 式 的 方向 友 展 ， 并 被 网 络 上 的 众多 计算 机 共享 ， 存 储 系统 变 得 更 
易 受 到 攻击 ， 相 对 静态 的 存储 系统 往往 成 为 攻击 者 的 首选 目标 。 因 此 ， 和 存储 安全 变 得 至 关 重 要 。 既 要 保证 文件 数据 完整 、 可 靠 、 不 泄密 ， 又 要 保证 只 有 合法 的 
用 户 才 能 够 访问 相关 的 文件 ， 因 而 存储 安全 成 为 信息 安全 研究 领域 的 焦点 话题 之 一 ， 主 要 涉及 存储 加 密 技术 、 数 据 清理 技术 、 数 据 备 份 及 灾难 恢复 技术 等 。 


1.2 存储 介质 


“存储 介质 ”是 存储 信息 的 载体 。 不 同 的 存储 介质 有 不 同 的 物理 形态 ， 并 采用 不 同 的 物理 原理 来 承载 信息 。 例 如 ， 纸 张 就 是 一 种 存储 介质 ， 文 字 信息 以 墨 
水 书写 的 方式 加 载 到 纸张 之 上 。 在 现代 社会 的 信息 化 领域 , 绝 大 部 分 信息 是 以 数字 形式 存在 的 ， 因 而 存储 介质 主要 被 用 作 和 存储 二 进 制 的 “0” 或 “1”。 数 字 信 
息 的 存储 介质 实质 上 是 实现 数字 信号 表示 的 物质 或 元 器 件 ， 这 种 物质 或 元 器 件 具 有 表现 两 种 相反 物理 状态 的 能 力 ， 这 两 种 物理 状态 的 改变 速度 决定 了 存储 器 的 
存 取 速 度 。 和 存储 介质 是 构成 存储 设备 的 基础 ， 目 前 常用 的 数字 存储 介质 有 磁 存 储 介质 (简称 磁 介 质 ) 、 光 存储 介质 (简称 光 介质 ) 和 半导体 存储 器 等 ， 下 面 将 
以 此 顺序 介绍 各 种 相关 的 存储 技术 。 


1.2.1 磁 介 质 


磁 存 储 介质 利用 磁场 和 磁 感 效 应 来 产生 读 写 二 进 制 数据 的 环境 ， 根 据 其 外 形 可 分 为 磁带 、 磁 训 、 磁 盘 等 。 磁 市 存储 容量 大 、 价 格 低 、 适 合 长 期 保存 ， 可 以 
在 较 低 的 成 本 下 实现 具有 TB 级 存储 容量 的 存储 系统 。 磁 盘 是 各 种 计算 机 系统 中 被 广泛 使 用 的 大 容量 外 人 存储器， 早期 磁盘 可 分 为 硬盘 和 软盘 两 类 。 硬 盘 盘 基 用 非 
磁性 轻金属 材料 制 成 ， 容 量 大 、 人 存 取 速度 快 ; 软盘 盘 基 用 挠 性 塑料 制 成 ， 容 量 小 、 可 拆 趣 、 携 市 方便 。 


1. 软 盘 


在 20 世 纪 60 年 代 示 70 年 代 初 期 ，1BM 公 司 推出 全 球 第 一 台 PC， 为 解决 计算 机 操作 指令 的 存储 问题 ， 其 于 1967 年 推出 世界 上 第 一 张 “ 软 盘 ”， 直 径 为 32 英 
寸 , 开局 了 软盘 的 研制 之 路 。1971 年 ，Alan Shugart 推 出 一 种 直径 为 8 贡 十 的 表面 涂 有 金属 氧化 物 的 塑料 质 磁 盘 ， 这 融 是 标 ) 付 软盘 的 “时 祖 ” ， 容 量 仅 为 
81KB。8 英 十 的 软盘 虽然 从 技术 原理 上 已 经 很 接近 现代 软盘 ， 但 缺陷 融 是 体积 过 大 ， 携 市 很 不 方便 ， 于 是 2.25 英 寸 软盘 诞生 了 。 为 了 改进 5.25 允 十 软盘 易 损 
坏 、 体 积 较 大 等 缺点 ， 索 尼 公 司 于 1980 年 率先 推出 体积 更 小 、 容 量 更 大 的 3.5 英 寸 软驱 和 软盘 ， 以 其 便宜 的 价格 、 相 对 更 大 的 存储 容量 很 快 全 面 占领 市 场 。20 
世纪 90 年 代 ，3.5 英 寸 /1.44MB 软 盘 一 直 是 PC 的 标准 数据 传输 方式 之 一 。 图 1-1 为 各 种 规格 的 软盘 。 然 而 ， 随 着 社会 信息 量 的 迅速 增加 ， 软 盘 容 量 过 小 、 读 写 
速度 慢 、 寿 命 租 、 可 靠 性 差 、 数 据 易 丢失 等 缺点 逐渐 显露 出 来 ， 已 不 能 满足 数据 存储 的 需求 。 特 别 是 在 以 U 盘 为 代表 的 大 容量 可 移动 存储 器 出 现 之 后 ， 软 盘 渐 
渐 地 淡出 了 人 们 的 视线 ， 时 至 今日 已 经 少 有 PC 支持 软盘 驱动 器 。 





图 1-1 各 种 规格 的 软盘 
2. 硬 盘 


1956 年 ，1BM 公 司 制造 了 第 一 款 硬 盘 驱 动 器 1BM350RAMAC， 包 含 50 张 24 英 寸 的 盘面 ， 容 量 不 到 ?5MB， 读 写 速 率 为 1.1KB/s。 以 现在 的 眼光 来 看 待 |BM 
公司 350RAMAC 还 算 不 上 真正 意义 的 硬盘 ， 但 它 开 创 了 信息 存储 的 新 时 代 。 随 后 1IBM 公 司 于 1980 年 制造 了 IBM3380， 它 是 首 个 容量 突破 1GB 的 硬盘 ， 总 容量 
2.52GB， 重 约 250kg。 硬 盘 自 出 现 之 后 便 成 为 计算 机 系统 的 重要 组 成 部 分 ， 与 不 断 改进 的 计算 机 处 设 接口 技术 相 结 合 ， 形 成 大 容量 、 高 速率 的 存储 系统 。 


硬盘 自 1956 年 诞生 以 来 ， 跨 过 了 60 年 的 风 风 雨 雨 ， 已 经 成 为 计算 机 主要 的 存储 媒介 。 回 顾 当 年 I BM 公司 发 明 的 世界 上 第 一 块 硬盘 仅 有 5MB 的 存储 空间 ， 
却 由 50 张 24 英 寸 的 碟 片 组 成 ， 所 占 体 积 在 现今 人 们 对 计算 机 的 理解 来 看 是 不 可 想象 的 。1973 年 ，IBM 公 司 又 成 功 研 制 了 新 型 的 曼彻斯特 硬盘 ， 拥 有 两 个 30MB 
的 存储 单元 ， 其 体积 大 大 缩小 ， 存 储 密度 也 大 为 提高 。 随 后 ， 硬 盘 驱 动 器 也 从 控制 技术 、 接 口 标准 、 机 械 结构 等 方面 进行 了 一 系列 的 改进 ,硬盘 朝 着 大 容量 、 
小 体积 、 高 读 取 速度 的 方向 不 断 有 发展。 硬盘 的 尺寸 也 从 最 初 的 5.25 英 寸 和 3.5 英 寸 再 降 到 了 2.5 英 寸 ， 其 应 用 领域 也 从 PC 拓展 到 了 便携 式 电子 产品 。 固 态 硬 盘 的 
出 现 是 硬盘 技术 的 一 个 重大 变革 ， 随 着 半导体 存储 心 片 的 成 本 逐渐 降低 、 稳 定性 逐渐 提高 ， 固 态 存 储 介质 已 经 在 消费 类 电子 产品 中 相当 普及 ， 在 PC 领域 也 大 
有 取代 硬盘 的 趋势 。 


硬盘 是 由 固定 面板 、 控 制 电路 板 、 盘 头 组 件 、 接 口 及 其 他 附件 等 组 成 ， 其 中 盘 头 组 件 是 构成 硬盘 的 核心 ， 封 六 在 硬盘 的 净化 腔 体 内 ， 包 括 浮动 磁头 组 件 、 
磁头 驱动 机 构 、 盘 上 刻 及 主轴 组 件 、 前 置 读 写 控制 电路 ,硬盘 的 内 部 结构 如 图 1-2 所 示 。 


浮动 磁头 组 件 由 读 写 磁头 、 传 动手 句 、 传 动 轴 三 部 分 组 成 。 磁 头 是 硬盘 技术 中 最 重要 和 关键 的 一 环 ， 实 际 上 是 集成 工艺 制 成 的 多 个 磁头 的 组 合 ， 它 采用 了 
非 接触 式 头 、 盘 结构 ， 加 电 后 在 高 速 旋转 的 磁盘 表面 飞行 ， 飞 高 间隙 只 有 0.1 ~ 0.3hum， 可 以 获得 极 高 的 数据 传输 率 。 现 在 转速 5400rpm 的 硬盘 飞 高 都 低 于 
0.3hHm， 以 利于 读 取 较 大 的 高 信 品 比 信和 号， 提供 数据 传输 存储 的 可 靠 性 。 


串 行 接口 
空气 过 滤 片 
主轴 (下 方 是 


轴承 和 蕊 达 
电机 ) 


首 立 马达 


水 人 磁铁 





图 1-2 ”硬盘 的 内 部 结构 


磁头 驱动 机 构 包 括 电 磁 线圈 电机 、 了 驱动 小 车 和 防震 动 沪 置 等 。 高 精度 的 轻型 磁头 驱动 机 构 能 够 对 磁头 进行 正确 的 驱动 和 定位 ， 并 在 很 短 的 时 间 内 精确 定位 
系统 指令 指定 的 磁道 ， 保 证 数据 读 写 的 可 靠 性 。 


盘 片 是 硬盘 存储 数据 的 载体 ， 现 在 的 盘 片 大 都 采用 金属 薄膜 磁盘 ， 这 种 金属 注 膜 较 之 软盘 的 不 连续 颗粒 载体 具有 更 高 的 记录 密度 ， 同 时 还 具有 高 贡 磁 和 高 
矫 奖 力 的 特点 。 主 轴 组 件 包括 主轴 部 件 如 轴承 和 驱动 电机 等 。 随 着 硬盘 容量 的 扩大 和 速度 的 提高 ， 主 轴 电 机 的 速度 也 在 不 断 提升 ， 有 厂商 开始 采用 精密 机 械 工 
业 的 液态 轴承 电机 技术 。 


前 置 读 写 控制 电路 控制 磁头 感应 的 信号 、 主 轴 电 机 调 速 、 磁 头 驱动 和 伺服 定位 等 ， 由 于 磁头 读 取 的 信号 微弱 ， 将 该 电路 密封 在 腔 体内 可 减少 外 来 信号 的 干 
扰 ， 提 高 操作 指令 的 准确 性 。 


与 软盘 类 似 ， 硬 鼻 逻 辑 上 被 划 为 磁道 、 柱 面 和 扇 区 ， 其 结构 关系 如 图 1-3 所 示 。 


磁头 扇 区 ”主轴 磁道 ” 盘 片 





图 1-3 ” 柱 面 和 一片 上 的 磁道 


每 个 盘 瞩 的 每 个 面 都 有 一 个 读 写 磁 头 ， 磁 头 起 初 停 在 盘 片 的 最 内 图 ， 该 区 域 不 存放 任何 数据 ， 称 为 局 停 区 或 着 陆 区 ， 其 他 区 域 束 是 数据 区 。 在 最 外 圈 ，0 
磁道 一 般 是 硬盘 数据 开始 存放 的 地 方 ， 它 存放 着 操作 系统 启动 时 所 必需 的 程序 代码 。 所 有 盘面 上 同一 磁道 构成 的 圆柱 即 为 柱 面 。 每 个 圆柱 上 的 磁头 由 上 而 下 从 
0 开始 编号 。 磁 头 读 写 数据 时 首先 在 同一 柱 面 内 从 0 磁头 开始 进行 操作 ， 依 次 向 下 在 同一 柱 面 的 不 同 盘 面 上 进行 操作 。 


硬盘 性 能 好 坏 是 由 其 相关 的 技术 参数 决定 的 ,硬盘 的 性 能 参数 主要 有 如 下 几 个 : 


(1) 容量 
作为 计算 机 系统 的 数据 存储 器 ， 容 量 是 硬盘 最 主要 的 参数 。 硬 盘 内 部 往往 有 多 个 蔷 起 来 的 磁盘 片 ， 所 以 说 “硬盘 容量 = 单 碟 容 量 x 碟 片 数 ”。 硬 盘 容 量 当 


然 是 越 大越 好 ， 以 便 可 以 六 下 更 多 的 数据 。 要 特别 说 明 的 是 ， 单 碟 容 量 对 硬盘 的 性 能 也 有 一 定 的 影响 : 单 碟 容 量 越 大 ， 硬 盘 的 密度 越 高 ， 磁 头 在 相同 时 间 内 可 
以 读 取 到 更 多 的 信息 ， 这 融 意 味 着 读 取 速 度 得 以 提高 。 


(2) 转速 


转速 是 硬盘 内 电机 主轴 的 旋转 速度 ， 也 就 是 硬盘 盘 片 在 一 分 钟 内 所 能 完成 的 最 大 转 数 。 转 速 的 快慢 是 标示 硬盘 档次 的 重要 参数 之 一 ， 它 是 决定 硬盘 内 部 传 
输 率 的 关键 因素 之 一 ， 在 很 大 程度 上 和 直接 影响 到 硬盘 的 速度 。 硬 盘 的 转速 越 快 硬盘 寻 找 文 件 的 速度 也 丈 越 快 ， 相 对 硬盘 的 传输 速度 也 惑 得 到 了 提高 。 


(3) 平均 访问 时 间 


平均 访问 时 间 是 指 磁头 从 起 始 位 置 到 目标 磁道 位 置 ， 并 且 从 目标 磁道 上 找到 要 读 写 的 数据 扇 区 所 需 的 时 间 ， 体 现 了 硬盘 的 读 写 速度 . 
(4) 传输 速率 


硬盘 的 数据 传输 率 是 指 硬 盘 读 写 数据 的 速度 ， 单 位 为 净 字 忆 每 秒 (MB/s) ， 包 括 内 部 数据 传输 率 和 外 部 数据 传输 率 ， 分 别 反 映 硬 盘 缓 冲 区 未 用 时 的 性 能 
和 系统 总 线 与 硬盘 缓冲 区 之 间 的 数据 传输 率 。 


(5) 缓存 


该 指标 指 在 硬盘 内 部 的 高 速 存储 器 。 缓 存 的 大 小 与 速度 是 直接 关系 到 硬盘 的 传输 速度 的 重要 因素 ， 能 够 大 幅度 地 提高 硬盘 整体 性 能 。DFT (Drive Fitness 
Test， 驱 动 器 健康 检测 ) 程序 对 硬盘 进行 检测 时 ， 可 以 让 用 户 方便 快捷 地 检测 硬盘 的 运转 状况 。 


硬盘 的 容量 越 来 越 大 ， 容 纳 的 资料 自然 也 越 来 越 多 ， 这 个 时 候 束 需要 硬盘 具有 较 高 的 可 靠 性 和 安全 性 ， 数 据 保护 技术 和 抗震 技术 只 会 变 得 越 来 越 重 要 ， 各 
个 厂商 应 该 在 此 投入 更 多 的 精力 。 目 前 主要 的 硬盘 数据 保护 技术 有 S.M.A.R.T 技 术 、DFT 技 术 、 加 密 技术 等 。 通 过 S.M.A.R.T. 技 术 ， 可 以 对 硬盘 潜在 故障 进行 有 
效 预测 ， 提 高 数据 的 安全 性 。 


1.22 让 质 


光 存 储 介质 的 主要 代表 为 光盘 存储 器 ， 其 利用 激光 读 出 和 写 入 信息 ， 主 要 优点 是 密度 高 、 容 量 大 ， 一 个 直径 12 严 寸 的 光盘 能 存储 2.5GB 人 信息， 位 存储 成 本 
低廉 。 但 是 光盘 的 存 取 时 间 要 比 磁盘 长 ， 一 般 为 100 ~ 500ms， 并 且 记 录 的 信息 不 易 擦 除 改 写 。 


第 一 张 光盘 于 1958 年 友 明 ， 之 后 虽然 对 光盘 数据 存储 的 研究 持续 了 几 十 年 ， 但 直到 1984 年 CD-ROM 黄 皮 书 的 公布 以 及 1988 年 只 读 光 盘 和 可 擦 除 光盘 的 出 
现 ， 光 盘 才 成 为 主要 数据 存储 介质 之 一 。 作 为 CD 的 友 展 ， 用 于 记录 视频 和 音频 的 数字 化 视频 光盘 (DVD) 产生 了 。 随 着 光盘 的 不 断 使 用 以 及 光 存 储 研究 的 不 
断 友 展 ， 光 盘 的 价格 急剧 下 降 ， 并 成 为 非常 重要 的 存储 设备 和 音频 视频 的 重要 载体 。 特 别 是 2003 年 国际 蓝光 光盘 标准 的 统一 ， 单 盘存 储量 可 达 50GB， 使 得 光 
盘存 储 在 社会 各 个 领域 得 到 了 广泛 应 用 。 

1. 光 盘 的 结构 及 其 工作 原理 

光 仓 储 是 由 光盘 表面 的 介质 实现 的 ， 其 盘面 上 有 凹凸 不 平 的 小 坑 ， 光 驱 中 的 激光 照射 到 上 面 会 有 不 同 的 光 反 射 回来 ， 光 驱 再 将 这 些 光 转化 成 0 或 1 的 二 进 制 
数据 。 反 之 ， 在 光盘 上 存储 数据 需要 借助 激光 把 二 进 制 数 据 “ 刻 ”在 遍 平 、 具 有 反射 能 力 的 盘 片 上 。 为 了 识别 数据 ， 将 激光 “ 刻 ” 出 的 小 坑 定 义 为 二 进 


制 “1”， 而 空 日 处 定义 为 “0”。 根 据 光 盘 的 结构 ， 光 盘 主 要 分 为 CD、DVD、 赣 光 光 盘 等 几 种 类 型 ， 它 们 虽然 在 结构 上 有 所 区 别 ， 但 是 主要 结构 及 其 原理 是 
一 致 的 ， 下 面 以 CD 为 例 来 介绍 光盘 的 结构 ， 如 图 1-4 所 示 。 
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图 1-4 光一 结构 示意 图 


CD; 盘 非常 沽 ， 只 有 1.2mm 厚 ， 主 要 分 为 五 层 ， 即 基板 、 记 录 层 、 反 射 层 、 保 护 层 、 印 刷 层 。 其 中 ， 基 槐 是 整个 光盘 的 物理 外 帝 ， 是 各 功能 性 结构 的 载 
体 ; 记录 层 是 刻录 信号 的 地 方 ; 反射 层 是 反射 光驱 激光 光束 的 区 域 ; 保护 层 用 来 保护 反射 层 以 及 防止 信号 被 破坏 ;印刷 层 是 印刷 客户 标示 、 容 量 等 信息 的 地 


光盘 驱动 器 负责 向 光盘 读 取 和 写 入 数据 ， 其 主要 的 部 分 是 激光 友 生 器 和 光 检 测 器 。 激 光 发 生 器 实际 上 是 一 个 激光 二 极 管 ， 它 可 以 产生 对 应 波长 的 激光 光 
束 ， 经 过 一 系列 处 理 反 射 到 光盘 上 ， 然 后 经 由 光 检 测 器 捕捉 反射 回来 的 信号 进而 识别 数据 。 光 盘 在 光盘 驱动 器 中 高 速 转动 ， 激 光头 在 电机 控制 下 前 后 移动 ， 数 
据 融 不 断 地 做 读 取出 来 。 目 前 主要 的 读 取 技术 有 三 种 ， 分 别 是 CLV 技 术 、CAV 技 术 和 PCAV 技 术 。 


CLV: (Constant Linear Velocity) 技术 恒定 线 速度 读 取 方式 ， 在 低 于 12 售 速 的 光驱 中 使 用 的 拷 术 。 它 为 了 保持 数据 传输 率 不 变 ， 而 随时 改变 旋转 光盘 
的 速度 。 读 取 内 部 数据 的 旋转 速度 比 外 部 要 快 许多 。 


CAV: (Constant Angular Velocity) 技术 恒定 角速度 读 取 万 式 。 它 是 用 同样 的 速度 来 读 取 光盘 上 的 数据 。 但 光盘 上 的 内 部 数据 比 外 沿 数 据 传输 速度 要 
低 ， 越 往外 越 能 体现 光驱 的 速度 ， 售 速 指 的 是 最 高 数据 传输 率 。 


PCAV: (Partial CAV) 技术 区 域 恒定 角速度 读 取 方式 ， 是 融合 了 CLV 和 CAV 的 一 种 新 技术 。 它 在 读 取 外 沿 数 据 时 采用 CLV 技 术 ， 在 读 取 内 部 数据 时 采用 
CAV 技 术 ， 以 提高 整体 数据 传输 的 速度 。 


2 光盘 的 分 类 


光盘 可 以 大 致 分 为 两 类 ， 一 类 是 只 读 光盘 (如 CD-ROM、DVD-ROM) ， 这 种 光盘 只 能 用 来 播放 已 经 记录 在 盘 片 上 的 信息 。 市 场 上 的 视频 录像 盘 及 数字 
音响 唱 盘 属于 此 类 。 另 一 类 是 可 写 光盘 (如 CD-Recordable、CD-R、MO 等 ) 。 可 写 光盘 又 包括 三 类 。 一 类 为 一 次 性 写 光 盘 ， 这 类 光盘 具有 读 写 功能 ， 它 可 
用 于 文档 存储 和 检索 以 及 图 像 存 储 和 处 理 。 另 一 类 为 可 重 写 光 盘 ， 这 类 光盘 除 用 来 写 、 读 信息 外 ， 还 可 以 将 已 经 记录 在 盘 上 的 信息 擦 去 ， 然 后 骨 写 入 新 的 信 
息 ,但 擦 和 写 需 要 两 束 激光 、 两 次 动作 才能 完成 ， 即 先 用 擦 激光 将 某 一 信道 上 的 信息 擦 除 ， 然 后 再 用 写 激 光 将 新 的 信息 写 入 。 还 有 一 类 为 直接 重 写 光盘 ， 这 类 
光盘 可 用 一 束 激光 、 一 次 动作 写 入 信息 ， 即 在 写 入 新 信息 的 同时 将 原来 的 信息 自动 擦 除 。 表 1-1 简 单 给 出 了 光盘 的 主要 种 类 和 应 用 领域 。 


表 1-1 主要 光盘 类 型 及 用 途 


光盘 类 型 用 途 


CD， 光 起 存储 数字 音频 信息 的 不 可 擦 除 光 盘 。 标 准 系统 采用 外 径 为 12cm 的 光盘 ， 
9 ) 1 有 a 2 7 站 EF, ~ 1 Me i 
可 记录 超过 60 分 钟 以 上 的 音频 数据 


存储 计算 机 数据 的 不 可 擦 除 光 盘 。 采 用 外 径 为 12cm 的 光盘 ， 存 储 容量 不 
CD-ROM， 只 谈 光 盘存 储 需 fi 般 
和 小 于 650MB 
EE 用 户 可 以 进行 一 次 写 入 的 光盘 。 采 用 外 径 为 12cm 的 光盘 ， 存 储 容量 不 小 
CD-R， 可 与 光盘 
和 650MB 

用 户 可 以 进行 重复 写 人 的 光盘 。 采 用 外 径 为 12cm 的 光盘 ， 存 储 容量 不 小 
和 6S0MB 

用 于 存储 数字 化 压缩 视频 信息 以 及 存储 大 容量 数字 信息 的 光盘 。 使 用 外 径 
为 8cm 或 12cm 的 盘 体 ， 双 面 存 储 容量 可 达 17GB。 基 本 DVD 是 只 读 设 备 


CD-RW， 可 重 写 光盘 


DVD， 数 子 视频 光盘 


DVD-R， 可 写 DVD 用 户 可 以 与 一 次 的 DVD 
DVD-RW， 可 重 写 DVD 用 尸 可 以 重 与 多 次 的 DVD 


由 于 光盘 类 型 不 同 ， 光 盘 容 量 和 尺寸 也 不 同 。 目 前 光盘 的 规格 、 尺 寸 和 容量 大 小 如 表 1-2 所 示 。 


表 1-2 光盘 的 尺寸 、 容 量 


型 号 名 称 厚 度 容 量 
ee i DVD: 4.7GB/S8.6GB 
120 型 光盘 外 径 120mm， 内 径 1 5mm 1.2mm 


CD: 6S0MB/700MB/8S00MB/890MB 


小 型 光盘 外 径 80mm， 内 径 21mm 200MB 


任 ， 56mm x 86mm, 60mm x 86mm 





名 片 光 盘 1.2mm 39 ~ 54MB 不 等 
: 22InI 
(经 ) 
型 号 名 称 厚 度 容 量 
外 径 : 56mm x 86mm，60mm x 86mm 
双 趾 形 泡 盟 , 1.2mm 30MB/50MB 
内 径 : 22mm 
异形 光盘 可 定制 3S0MB/87MB/140MB/200MB 
光盘 存储 技术 近年 来 发 展 比较 迅速 。 相 比 于 其 他 存储 技术 而 言 ， 它 县 有 很 多 独特 的 优点 ， 如 存储 密度 高 、 容 量 大 ， 这 是 由 光盘 的 高 道 密度 所 决定 的 。 光 盘 


可 通过 光 对 记录 介质 的 反射 实现 精密 的 道 跟踪 ， 其 道 间 距 在 1ym 以 下 ， 远 小 于 硬盘 的 道 间 距 。 随 着 光盘 技术 的 不 断 友 展 ， 还 可 能 通过 采用 短波 激光 器 和 大 数值 
孔径 的 物镜 进一步 缩小 记录 点 的 直径 ， 以 提高 光盘 的 存储 密度 。 


光盘 寿命 相对 较 长 。 由 于 光盘 的 记录 读 出 头 和 盘面 不 接触 ， 在 使 用 光盘 多 次 读 出 时 ， 光 盘 表 面 的 记录 信息 不 会 被 破坏 ， 同 时 也 延长 了 光盘 的 使 用 寿命 。 在 
常温 下 ， 数 据 保存 寿命 可 超过 100 年 。 


随 着 光学 技术 、 微 电子 、 激 光 技 术 、 材 料 科学 、 细 微 加 工 技 术 、 计 算 机 与 自动 控制 技术 的 友 展 ， 光 盘存 储 技术 在 存储 密度 、 容 量 、 数 据 传输 率 、 功 能 多 样 
化 等 方面 都 有 很 大 的 友 展 。 光 盘 不 仅 适 用 于 大 数据 信息 的 存储 和 交换 ， 而 且 还 能 同时 和 存储 图 、 文 、 声 、 像 等 各 种 信息 ， 满 足 信息 存储、 传输 和 管理 的 要 求 ， 
而 得 到 了 广泛 应 用 ， 特 别 是 在 音像 出 版 领域 。 


= 


1.2.3 ”半导体 仓储 器 


半导体 存储 器 (semi-conductor memory) 是 一 种 以 半导体 电路 作为 存储 媒介 的 存储 器 ， 按 其 功能 可 分 为 随机 存 取 和 存储 器 (RAM) 和 只 读 存 储 器 
(ROM) 。 


所 谓 “ 固 态 和 存储” 技术 ， 指 的 残 是 以 半导体 存储 器 件 为 介质 进行 数据 存储 和 读 取 的 一 种 技术 。 早 期 的 固态 存储 技术 主要 是 基于 DRAM 的 ， 近 年 来 ， 基 于 
Flash 的 固态 存储 技术 日 趋 成 就， 逐渐 与 基于 DRAM 的 固态 存储 技术 各 领 风 骚 ， 成 为 当今 固态 存储 领域 的 两 大 技术 流派 。 对 于 Flash 来 说 ， 根 据 存 储 单元 组 织 结 


-/ \ 口 


构 的 不 同 ， 主 要 可 以 分 为 NAND 型 和 NOR 型 。NOR Flash 是 Intel 公 司 在 1988 年 提出 的 存储 染 构 ，NAND Flash 是 TOSHIBA 公 司 在 1989 年 提出 的 存储 染 构 。 两 


者 都 是 基于 “浮动 门 场 效 应 管 ”的 半导体 仓储 器 件 ， 都 是 非 易 失 性 存储 器 ， 基 本 操作 包括 读 、 编 程 (或 写 ) 和 探 除 。NOR Flash 成 本 相对 较 高 ， 通 常用 于 存储 
小 容量 的 代码 ; NAND Flash 则 通常 作为 大 容量 存储 器 件 ， 某 些 场 合 下 可 用 于 蔡 代 磁 存 储 介质 ， 以 获得 更 快 的 存储 速度 和 更 好 的 稳定 性 。 


有 关 NAND 闪 人 存 技 术 是 本 书 的 重点 内 容 ， 有 关 NAND 闪 人 存 固态 硬盘 的 更 多 细节 将 在 后 续 章节 陆续 展开 讲述 。 


1.3 ”磁盘 阵列 


目前 单 块 磁盘 的 容量 已 经 能 达到 8TB， 但 这 对 于 现代 应 用 程序 来 说 还 远 远 不 够 。 那 么 是 否 必须 要 制造 单 盘 容量 更 大 的 硬盘 ， 为 解决 这 个 问题 人 们 发 明了 
RAID (Redundant Arrays of Independent Disks， 独 立 磁盘 元 余 阵 列 ) 技术 。 


RAID 最 初 是 为 了 组 合 小 的 廉价 磁盘 来 代表 大 的 昂贵 磁盘 ， 同 时 希望 磁盘 失效 时 不 会 对 数据 的 访问 造成 损失 而 开 友 的 一 定 水 平 的 数据 保护 技术 。 它 就 是 一 
种 由 多 块 廉价 磁盘 构成 的 元 余 阵列 ， 在 操作 系统 下 作为 一 个 独立 的 大 型 存储 设备 出 现 。RAID 充 分 友 挥 出 多 块 硬盘 的 优势 ， 可 以 提升 硬盘 速度 ， 增 大 容量 ,， 提 
供 容错 功能 ， 确 保 数据 的 安全 性 ， 易 于 管理 ， 并 在 任何 一 块 硬盘 出 现 问题 的 情况 下 都 可 以 继续 工作 ， 不 会 受到 损坏 硬盘 的 影响 。 


RAID 简 单 的 理解 就 是 将 多 台 硬 盘 通 过 RAID 控 制 器 (基于 软件 和 硬件 ) 结合 成 虚拟 单 台 大 容量 的 硬盘 使 用 。 目 前 ，RAID 技 术 的 实现 方式 大 致 分 为 两 种 : 基 
于 硬件 的 RAID 技 术 和 基于 软件 的 RAID 技 术 。 基 于 软件 的 RAID 包 含 在 操作 系统 中 ， 其 RAID 功 能 完全 用 软件 方式 由 系统 的 核心 磁盘 代码 来 实现 。 基 于 硬件 的 
RAID 是 利用 硬件 RAID 适 配 卡 来 实现 的 。RAID 适 配 卡 上 和 集成 了 处 理 器 ， 能 够 独立 于 主机 对 存储 子 系统 进行 控制 。 因 为 拥有 自己 独立 的 存储 器 和 处 理 器 ，RAID 
适 配 卡 可 以 自己 计算 奇偶 校 验 信息 并 完成 文件 定位 ， 减 少 对 主机 CPU 运 算 时 间 的 占用 ， 提 高 了 数据 传输 速度 。 由 此 可 见 ， 基 于 硬件 的 RAID 比 基于 软件 的 RAID 
在 工作 性 能 上 和 要强 一 些 。 


根据 组 成 磁盘 阵列 的 磁盘 组 织 架 构 、 数 据 布局 以 及 相关 技术 的 不 同 ， 磁 盘 阵 列 可 以 分 为 多 种 级 别 。 
1.RAIDO 


RAID0 是 最 早出 现 的 RAID 模 式 ， 即 数据 分 条 (Data stripping) 技术 。RAID0O 是 组 建 磁盘 阵列 中 最 简单 的 一 种 形式 ， 只 需要 两 个 以 上 的 硬盘 即 可 ， 成 本 
低 ， 且 可 以 提高 整个 磁盘 的 性 能 和 吞吐 量 。RAI1D0 没 有 提供 见 余 或 错误 修复 能 力 ， 但 实现 成 本 是 最 低 的 。 


RAID0 最 简单 的 实现 方式 束 是 把 N 个 同样 的 硬盘 用 硬件 的 形式 通过 智能 磁盘 控制 器 或 用 操作 系统 中 的 磁盘 驱动 程序 以 软件 的 方式 串联 在 一 起 创建 一 个 大 的 
卷 集 。 人 在 使 用 中 计算 机 数据 依次 写 入 各 硬盘 中 ， 它 的 最 大 优点 就 是 可 以 成 倍 地 提高 硬盘 的 容量 。 最 大 的 缺点 在 于 任何 一 个 硬盘 出 现 故 障 ， 整 个 系统 将 会 受到 破 
坏 ， 可 靠 性 仪 为 单独 一 个 硬盘 的 1/N。 为 了 解决 这 一 问题 ， 便 出 现 了 RAID0 的 另 一 种 模式 ， 即 在 N 个 硬盘 上 选择 合理 的 市 区 来 创建 市 区 集 ， 其 原理 残 是 将 原先 
顺序 写 入 的 数据 分 散 到 所 有 的 N 个 硬盘 中 同时 进行 读 写 ， 这 样 对 N 个 硬盘 的 并 行 操作 使 得 同一 时 间 内 磁盘 读 写 的 速度 较 串 联 读 写 模式 提升 了 N 倍 。 


虽然 RAID0 可 以 提供 更 多 的 空间 和 更 好 的 性 能 ,但 是 整个 系统 是 非常 不 可 靠 的 ， 如 果 出 现 故障 ， 无 法 进行 任何 补救 。 所 以 ，RAID0 一 般 只 是 在 那些 对 数据 
安全 性 要 求 不 高 的 情况 下 才 被 人 们 使 用 。 

2.RAID1 

RAID1 是 利用 镜像 拷 术 来 实现 存储 数据 容错 的 阵列 技术 ， 又 称 为 磁盘 镜像 ， 它 对 存放 的 数据 完全 见 余 ， 通 过 简单 地 将 一 个 盘 上 的 数据 镜像 到 另 一 个 盘 上 来 
实现 数据 元 余 ， 当 数据 写 在 某 一 个 硬盘 上 时 ， 它 会 同时 被 写 到 相应 的 镜像 盘 上 ， 在 不 影响 性 能 的 情况 下 最 大 限度 地 保证 了 系统 的 可 靠 性 和 可 修复 性 。RAID1 中 


的 数据 盘 与 镜像 盘 没 有 主 从 关系 ， 它 们 可 以 相互 镜像 或 恢复 。 这 种 方法 虽然 简单 ， 但 实现 成 本 却 要 比 RAID0 贵 一 倍 。 在 这 种 模式 下 ， 任 何 一 个 硬盘 出 现 故 障 都 
“会 影响 到 整个 阵列 的 正常 工作 ， 因 为 它 还 有 一 个 镜像 盘 可 以 工作 ， 其 至 在 一 半数 量 以 上 的 硬盘 出 现 问 题 时 系统 都 可 以 正常 工作 。 


RAID1 主 要 是 通过 二 次 读 写 实现 磁盘 镜像 ， 因 此 磁盘 控制 器 的 负载 也 相当 大 ， 尤 其 是 在 需要 频繁 写 入 数据 的 环境 中 。 为 了 避免 出 现 性 能 浇 贷 ， 使 用 多 个 磁 
盘 控 制 器 融 显 得 很 有 必要 。 


3.RAID2 





RAID2 采 用 内 存 系 统 中 常用 的 纠 错 码 一 一 汉 明 码 进 行 数据 保护 。 汉 明码 是 在 原 有 数据 中 插入 若干 校 验 码 来 进行 错误 检查 和 纠正 的 编码 技术 ， 它 根据 现 有 的 
数据 编码 各 位 的 值 ， 生 成 自己 的 校 验 码 ， 然 后 再 将 校 验 码 与 原来 的 数据 码 合 并 ， 转 换 成 新 的 数据 编码 。 


RAID2 中 也 采用 数据 条 市 的 方式 进行 存 取 ， 在 RAID2 中 ， 条 市 非常 小 ， 用 尸 数 据 以 位 或 字 节 为 单位 进行 条 纹 化 ， 划 分 为 若干 相互 重 芍 的 子 集 ， 每 个 子 集 的 
用 户 数 据 计算 校 验 数据 并 存放 在 一 个 校 验 磁盘 上 。 当 一 个 磁盘 友 生 故障 时 ， 几 个 校 验 组 的 数据 会 不 一 至， 而 丢失 数据 即 为 这 几 个 校 验 组 共同 包含 的 数据 ， 用 其 
中 一 个 校 验 组 的 剩余 数据 即 可 恢复 丢失 数据 。RAID2 一 般 应 用 于 多 磁盘 易 出 错 环境 中 ， 对 于 单 磁盘 而 言 意义 不 大 。 


4.RAID3 


RAID3 是 在 RAID2 的 基础 上 友 展 而 来 的 ， 天 键 是 使 用 相对 简单 的 奇偶 校 验 代 蔡 了 较为 复杂 的 汉 明 码 校 验 ， 大 大 降低 了 阵列 的 成 本 。 与 RAID2 不 同 的 是 ,无 


论 磁盘 阵列 数目 有 多 少 ，RAID3 只 需要 单个 几 余 校 验 盘 。 在 RAID3 中 ， 数 据 分 布 在 不 同 的 较 小 的 条 市 上 ， 并 且 进 行 并 行 方式 读 写 操作 。 如 果 一 块 磁盘 失效 ， 奇 
偶 盘 与 其 他 数据 盘 可 以 重新 生成 数据 ， 如 果 奇 偶 盘 失效 则 不 影响 数据 使 用 。 


2.RAID4 


RAID4 是 独立 的 数据 盘 和 共享 的 校 验 盘 阵列 技术 ， 它 以 数据 块 为 单位 进行 存储 空间 分 配 。RAID4 使 用 一 个 磁盘 作为 奇偶 校 验 盘 ， 每 次 写 操作 都 需要 访问 校 
验 盘 ， 这 时 校 验 盘 也 会 成 为 写 操作 的 瓶 矣 。 


RAID4 与 RAID3 基 本 相同 ， 不 同 之 处 在 于 RAID4 玉 用 粗 粒 度 条 纹 化 ， 条 纹 单 元 较 大 。 由 于 条 纹 单 元 较 大 ， 多 数 较 小 请 求 只 涉及 一 个 磁盘 ， 磁 盘 阵 列 可 并 行 
处 理 多 个 请 求 。 因 此 RAID4 更 适合 用 于 并 发 度 高 ， 而 请 求 相对 较 小 的 应 用 。 但 对 于 相对 较 大 的 请 求 ，RAID4 也 可 提供 较 高 的 数据 传输 率 。 


6.RAID5 


RAID5 是 目前 市 场 上 最 常见 的 RAID 产 品 ， 它 是 一 种 无 独立 校 验 盘 的 奇偶 校 验 硬盘 阵列 ， 它 具有 较 高 的 存储 性 能 、 较 强 的 数据 安全 性 以 及 实现 成 本 低 等 特 
挟 。 它 的 奇偶 校 验 码 存 在 于 所 有 磁盘 上 ， 当 硬盘 出 现 间 题 时 ， 可 以 利用 剩 下 的 数据 和 对 应 的 奇偶 校 验 信息 来 恢复 磁盘 阵列 和 正常 工作 。RAID3 与 RAID5 相 比 ， 
重要 的 区 别 在 于 RAID3 每 进行 一 次 数据 传输 ， 需 涉及 所 有 的 阵列 盘 。 而 对 于 RAID5 来 说 ， 大 部 分 数据 传输 只 对 一 个 磁盘 操作 ， 可 进行 并 行 操作 。 在 RAID5 中 
有 “ 写 损 失 ”， 即 每 一 次 写 操作 ， 将 产生 四 个 实际 的 读 / 写 操作 ， 其 中 两 次 读 旧 的 数据 及 奇偶 信息 ， 两 次 写 新 的 数据 及 奇偶 信息 。 


7.RAID6 


RAID6 的 基本 思想 残 是 进行 两 种 不 同 的 奇偶 计算 ， 并 将 校 验 数据 分 开 仓储 在 不 同 的 磁盘 上 。 那 么 ， 如 果 用 户 需 要 N 个 磁盘 的 阵列 ， 则 总 的 磁盘 数目 将 是 
N+2。RAID6 在 设计 时 引入 两 级 见 余 的 拷 术 ， 主 要 是 为 了 保证 即使 阵列 中 出 现 两 个 硬盘 同时 失效 ,仍然 能 够 正常 工作 ， 并 恢复 相应 的 数据 。 该 技术 把 数据 和 校 
验 信息 分 布 到 一 组 硬盘 中 ， 当 有 硬盘 失效 时 ， 丢 失 的 那 部 分 数据 则 可 以 通过 剩余 硬盘 上 的 数据 和 校 验 信息 通过 计算 而 恢复 。 所 以 说 ，RAID6 是 一 种 双重 奇偶 校 
验 存 取 阵列 。RAID6 的 控制 器 在 设计 时 非常 复杂 ， 实 现成 本 极 高 ， 目 前 主要 用 于 数据 绝对 安全 的 环境 中 ， 不 太 适 合 于 普及 应 用 .。 


在 实际 应 用 中 ， 选 择 相应 RAID 级 别 主 要 依据 可 用 性 、 和 存储 性 能 和 实现 成 本 这 三 个 因素 ，RAID 基 本 级 别 的 一 些 主要 特征 如 表 1-3 所 示 。 


表 1-3 RAID 级 别 对 照 表 


硬 盘 数 
起 性 能 高 ， 写 性 能 高 条 1 个 以 上 
起 性 能 低 ， 写 性 能 低 全 镜像 7N 


根据 数据 位 宽 决 
定 ， 数 据 盘 加 校 验 盟 
污 性 能 高 ， 写 性 能 最 低 数据 条 审 分 段 ， 并 使 用 奇偶 校 验 但 3 个 以 上 
便 盘 并 行 输 入 、 输 出 数据 条 种 ， 并 使 用 奇偶 校 验 公 3 上 
壹 性 能 言 ， 写 性 能 低 数据 和 化 ， 硬 点 分 段 ， 并 使 用 奇偶 校 验 但 ， [WE 

并 将 校 验 值 分 布 在 各 便 盘 上 


该 写 性 能 受到 校 验 的 影响 使 用 两 级 完 余 校 验 技 术 下 站 [江上 上 


没有 提高 效 据 条 市 化 ， 便 盘 分 段 ， 并 使 用 汉 明 码 纠 销 





1.4 网 络 化 存储 


数据 量 的 大 幅 增 长 为 存储 系统 设计 市 来 了 新 的 挑战 ， 要 求 有 更 多 的 存储 设备 存放 不 断 增加 的 数据 ， 同 时 也 需要 在 多 个 用 户 之 间 实 现 数 据 共享 ， 以 提高 存 作 
系统 的 利用 率 。 另 外 ， 管 理 海量 数据 需要 占用 相应 服务 器 的 大 部 分 处 理 能 力 ， 这 惑 推动 了 独立 于 单个 主机 的 专用 存储 系统 的 出 现 。 在 充分 吸收 网 络 技术 的 基础 
上 ， 大 容量 、 可 共享 、 可 扩展 的 网 络 仓储 系统 应 运 而 生 。 


1.4.1 网 络 存储 架构 


在 海量 信息 的 发 展 背 景 下 ， 网 络 存 储 逐 渐 成 为 大 规模 存储 系统 的 基本 体系 结构 ， 网 络 存储 染 构 主要 有 直 连 式 存 储 、 网 络 连 接 存 储 和 存储 区 域 网 络 等 。 
1. 直 连 式 存储 (DAS) 


直 连 式 存 储 的 全 称 是 Direct Attached Storage， 简称 DAS， 是 一 种 存储 设备 直接 通过 总 线 适配器 和 电 比 (SCSI 或 FC) 连接 到 服务 器 的 架构 ， 典 型 DAS 的 


结构 如 图 1-5 所 示 。DAS 依 赖 于 服务 器 ， 本 身 不 带 有 任何 存储 操作 系统 。 主 机 的 内 部 磁盘 、 磁 带 库 和 直接 连接 的 外 部 磁盘 组 ， 都 是 一 些 DAS 实 例 。 
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以 太 网 





服务 器 





SCSI SCSI SCSI 





磁带 机 磁盘 阵列 磁盘 阵列 磁盘 阵列 
图 1-5 “典型 DAS 结 构图 


根据 存储 设备 相对 于 主机 的 位 置 ， 直 和 连 式 存 储 可 以 分 为 内 置 和 外 置 两 种 。 在 内 置 DAS 架 构 里 ， 存 储 设备 通过 串 行 或 并 行 尽 线 连 接 主 机 ， 但 忌 线 自身 有 传输 
距离 和 挂 载 设备 的 限制 。 在 外 置 DAs 架 构 里 ， 服 务 器 直接 连接 到 外 部 仓储 设备 ， 相 比 于 内 置 DAS， 外 置 DAs 克 服 了 距离 和 挂 载 设 备 数量 的 限制 。 


对 于 少量 PC 或 服务 器 ， 使 用 DAs 连 接 简单 、 易 于 配置 和 管理 、 价 格 较 低 。 相 对 于 其 他 网 络 人 存储 架构 ，DA3s 是 最 简单 的 解决 方案 ， 所 需 的 管理 任务 更 少 ， 
需要 设置 和 操作 的 硬件 和 软件 也 更 少 。 但 是 DAs 对 服务 器 依赖 性 太 强 ， 要 求 每 台 计 算 机 单独 拥有 目 己 的 存储 磁盘 ， 这 不 利于 人 存储 容量 的 充分 利用 和 服务 器 间 的 
数据 共享 ， 而 且 DAS 方 式 下 数据 依然 是 分 散 的 ， 不 同 的 应 用 各 有 一 套 存储 设备 ， 没 有 统一 的 管理 方案 ， 不 利于 数据 的 维护 ， 因 此 DAS 不 适合 作为 企业 级 的 存储 
解决 方案 。 

2. 网 络 连接 存储 (NAS) 

随 痢 网 络 的 友 展 、 数 据 量 和 客户 端的 增多 ， 对 服务 器 的 存储 能 力 和 访问 性 能 提出 了 新 的 挑战 。 这 种 情况 迅速 导致 了 服务 器 的 专 一 化 ， 进 而 导致 了 服务 器 和 
存储 设备 的 分 离 。 

网 络 连 接 存 储 的 英文 全 称 是 Network Attached Storage， 简 称 NAS， 它 的 核心 思想 是 将 存储 设备 从 服务 器 上 分 离 出 来 ， 在 网 络 中 提供 专门 负责 文件 服务 


的 服务 器 ， 从 而 减轻 网 络 其 他 服务 器 的 负担 。NAS 是 一 种 专用 的 、 高 性 能 的 、 高 速 的 网 络 文件 存储 备份 设备 ， 使 用 网 络 和 文件 共享 协议 实现 文件 归档 和 存储 等 
功能 。 共 享 协议 包括 用 于 数据 传输 的 TCP/IP 以 及 用 于 远程 文件 服务 的 CIFS 和 和 NFS 协议， 可 以 为 不 同文 件 协 议 客户 端 提供 集中 式 服务 。 


NAS 有 自己 简化 的 实时 操作 系统 ， 它 将 硬件 和 软件 有 机 地 结合 在 一 起 ， 用 以 提供 文件 服务 ， 如 图 1-6 所 示 。 它 主要 由 客户 端 、NAS 服 务 器 和 存储 设备 三 部 
分 组 成 。 其 中 ，NAS 服 务 器 主要 负责 喘 应 文件 请 求 。 通 过 网 络 接 口 ，NAS 服 务 器 的 一 端 通过 以 太 网 接口 连接 到 前 端 局 域 网 ， 另 一 端 通 过 ATA、SATA 或 FC 等 存 
储 设备 接口 与 后 端 人 存储 设 备 相 连 。 人 存储 设备 通常 由 高 性 能 的 磁盘 阵列 组 成 。 


客户 端 NAS 服 务 器 
应 用 程序 应 用 程序 NAS 管 理 软件 
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图 1-6 NAS 的 构成 


NAS 的 软件 构成 主要 包括 操作 系统 、 文 件 协 议和 存储 管理 软件 。 其 中 NAS 操 作 系 统 是 通用 操作 系统 的 简化 版 ， 它 只 保留 了 操作 系统 的 文件 服务 功能 和 相关 
文件 通信 协议 ， 负 责 管 理 NAs 设 备 的 硬件 和 软件 资源 。 目 前 ，NAs 操 作 系统 主要 有 各 种 Windows 版 、FreeBSD/Linux 版 、VxWeorks 版 以 及 实时 操作 系统 
RTOS。NAs 目 前 采用 的 文件 协议 是 NFs 和 CIFS。 其 中 NFS 应 用 在 UNIX 环 境 下 最 早 由 3un 公 司 开 友 ; CIFS 应 用 在 NT/Windows 环 境 下 由 微软 公司 开发 。 


NAS 的 结构 以 及 采用 的 各 种 协议 使 得 NAS 与 传统 存储 技术 相 比 具有 以 下 优点 : 


1) 用 户 直 接 访问 NAS, 减少 了 通用 服务 器 成 为 网 络 瓶 贷 的 概率 。NAS 具 有 更 好 的 扩展 性 和 灵活 性 。 存 储 设备 不 受 地 域 限制 ， 在 不 同 地 点 都 可 以 通过 物理 
连接 和 网 络 连 接连 起 来 。 


2) 支持 跨 平台 存放 文件 数据 和 共享 访问 。 基 于 TCP/IP 的 数据 传输 使 得 NAS 可 以 支持 网 络 文件 系统 ， 不 同 操作 系统 可 以 实现 文件 共享 。 
3) 使 用 专用 的 、 经 过 优化 的 操作 系统 ， 不 仅 响 应 速度 快 ， 而 且 数 据 传 输 速 率 也 更 高 。 


4) 由 于 是 专用 硬件 构造 的 专用 服务 器 ， 不 会 占用 网 络 服务 器 的 系统 资源 ， 不 需要 在 服务 器 上 安装 任何 软件 ， 当 增加 或 删除 NAs 设 备 时 不 会 中 断 网 络 的 运 
行 ， 安 装 和 使 用 更 为 方便 ， 是 一 种 即 插 即 用 的 网 络 设备 。 


5) NAs 独 立 于 主 服务 器 ， 因 此 对 主 服务 器 没有 任何 需求 ， 这 大 大 降低 了 主 服务 器 的 投资 成 本 。 


网 


在 实际 应 用 中 ，NAs 也 表现 出 了 一 些 缺点 。 首 先 ， 随 着 网 络 中 数据 流 的 不 断 增 大 ，NAs 在 LAN 上 传输 数据 时 ， 会 将 大 量 的 整 块 数据 划分 成 多 个 数据 包 。 
样 会 造成 对 NAs 处 理 资 源 占 用 率 过 大 ， 进 而 直接 影响 NAs 对 用 户 请 求 的 响应 速度 和 仓储 服务 的 提供 能 力 。 其 次 ，NAs 设 备 与 客户 端 通过 企业 网 络 进行 连接 ， 
此 数据 备份 或 存 储 过 程 中 会 占用 网 络 的 市 宽 ， 各 用 户 频繁 使 用 网 络 时 ，NAs 的 备份 机 制 出 现 问题 ， 对 用 户 网 络 来 说 会 产生 很 严重 的 后 果 。 


加 


NAS 设 备 近 些 年 在 海量 数据 存储 、 异 地 备份 容 灾 、 网 络 存 储 平台 、 军 用 存储 等 方面 得 到 了 广泛 的 应 用 ， 各 种 NAS 产 品 也 应 运 而 生 。 其 中 NetApp 公 司 掌握 
了 全 球 最 先进 的 NAS 方 面 的 相关 技术 ， 它 的 FAS 系 列 产 品 统治 了 NAS 市 场 的 大 半 江 山 。 近 年 来 初 圳 锋芒 的 BlueArc 公 司 在 其 NAS 产 品 Titan 系 列 中 ， 将 其 运行 的 
所 有 软件 逻辑 都 写 入 EPGA 中 ， 使 得 系统 处 理 速 度 越 来 越 快 。 除 此 之 外 ，EMC、IBM、HP、sSun、Veritas 等 公司 均 推 出 了 自己 的 NAs 产 品 。 


3. 存 储 区 域 网 络 (SAN) 


存储 区 域 网 络 的 英文 全 称 是 Storage Area Network， 简 称 9AN ， 它 是 一 种 高 速 专用 网 络 ， 用 于 连接 人 存储 设备 和 服务 器 ， 一 般 采 用 光纤 通道 协议 作为 底层 
通信 协议 。SAN 的 发 展 历程 较 短 ， 从 20 世 纪 90 年 代 后 期 兴起 ， 由 于 当时 以 大 网 的 带宽 有 限 ， 早 期 的 SAN 存 储 系统 多 数 由 FC 存储 设备 构成 ， 随 着 干 兆 以 太 网 的 
普及 和 万 兆 以 太 网 的 实现 ， 基 于 iSCSI 协议 的 IP SAN 浮 出 水 面 并 不 断 被 人 们 认可 。 


SAN 实 际 上 是 一 种 专门 为 存储 建立 的 独立 于 TCP/IP 网 络 之 外 的 专用 高 速 网 络 ， 其 结构 如 图 1-7 所 示 ， 主 要 包括 如 下 几 个 部 分 : 
1) SAN 服 务 器 : 服务 器 基础 结构 是 所 有 SAN 解 决 方案 的 前 提 ， 这 种 基础 结构 是 多 种 服务 器 平台 的 混合 体 ， 包 括 Windows NT 和 不 同 风格 的 UNIX 等 。 


2) SAN 和 存储 设备 : 存储 基础 结构 是 信息 所 依赖 的 基础 ， 新 型 的 基础 结构 应 该 能 够 提供 更 好 的 网 络 可 用 性 、 数 据 访问 性 和 系统 管理 性 。 因 此 ，SAN 解 放 了 
存储 设备 ， 使 其 不 依赖 于 特定 的 服务 器 总 线 ， 而 且 将 其 直接 接 入 网 络 。SAN 还 支持 存储 设备 的 集中 化 和 服务 器 群集 ， 使 其 管理 更 加 容易 ， 费 用 更 加 低廉 。 


3) SAN 连 接 设备 : 实现 需要 考虑 的 第 一 个 要 素 是 ， 通 过 光纤 通道 之 类 的 技术 实现 存储 和 服务 器 组 件 的 连通 性 。 实 现 LAN 和 WAN 所 使 用 的 典型 组 件 有 扩展 


器 、 集 线 器 、 路 由 器 、 网 桥 和 网 关 等 。 与 LAN 一 样 ， 通 过 存储 接口 的 互 连 形成 很 多 网 络 配 置 ， 并 能 够 跨越 很 长 的 距离 。 


4) SAN 管 理 软 件 : 其 管理 服务 器 、 互 连 设备 以 及 存储 设备 之 间 的 接口 ， 它 提供 SAN 环 境 的 一 个 可 视 化 视图 ， 并 且 可 以 在 一 个 中 心 控制 台 进 行 多 种 资源 的 
集中 管理 。 
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图 1-7 ”SAN 结构 示意 图 


FC SAN 是 一 种 典型 的 SAN 结 构 ， 它 以 光纤 为 传 巡 介质 ， 具 有 传输 速度 快 、 可 靠 性 高 、 传 输 距 离 远 等 特点 ， 它 将 仓储 设备 从 传统 的 以 太 网 中 分 离 出 来 ， 成 


为 独立 的 存储 区 域 网 络 ， 服 务 器 可 以 访问 存储 区 域 网 络 上 的 任何 存储 设备 ， 同 时 存储 设备 之 间 以 及 存储 设备 与 SAN 交 换 机 之 间 也 可 以 进行 通信 ， 其 体系 结构 如 
图 1-8 所 示 。 


利用 SAN， 不 仅 可 以 提供 大 容量 的 存储 数据 ， 而 且 地 域 上 可 以 分 散 ， 缓 解 了 大 量 数据 传输 对 局 域 网 的 影响 。SAN 结 构 人 允许 任何 服务 器 连接 到 任何 存储 阵 
列 ， 不管 数据 置 放 在 哪里 ， 服 务 器 都 可 直接 存 取 所 需 的 数据 。 


SAN 的 主要 优点 是 : 


1) 高 性 能 、 高 速 存 取 ， 可 实现 高 速 计算 机 与 高 速 存储 设备 的 高 速 互 连 。 目 前 FC 可 提供 2Gbit/s 的 这 守 ,新 的 10Gbit/s 的 标准 也 正在 制定 之 中 。 


2) 高 可 用 性 。 网 络 用 户 可 以 通过 不 止 一 台 服 务 器 访问 存储 设备 ， 当 一 台 服 务 器 出 现 故 障 时 ， 其 他 服务 器 可 以 接管 故障 服务 器 的 任务 。 


~ 


~ 


3) 集中 存储 和 管理 。 通 过 整合 各 种 不 同 的 存储 设备 形成 一 个 统一 的 存储 池 ， 向 用 尸 提供 服 务 ， 存 储 容量 可 以 很 容易 地 扩充 。SAN 提 供 了 大 容量 存储 设备 
共享 的 解决 方案 。 





RAID 子 系统 。 RAID 子 系统 ” RAID 子 系统 
图 1-8 ”FC SAN 体 系 架构 


4) 可 扩展 性 高 。 服 务 器 和 存储 设备 相 分 离 ， 两 者 的 扩展 可 以 独立 进行 。 理 论 上 扩展 不 受 限 制 ， 并 且 支 持 在 线 扩 展 ， 扩 展 的 同时 也 保证 了 可 靠 性 和 安全 
性 。 通 过 FC 网 卡 、 集 线 器 、 交 换 机 等 互 连 设备 ， 用 户 可 根据 需要 灵活 地 配置 服务 器 和 存储 设备 。 


5) 可 实现 数据 快速 备份 ， 并 且 数 据 备份 不 占用 LAN 市 宽 。 
6) 可 兼容 以 前 的 各 种 SCsI 存 储 设 备 ， 保 护 用 户 以 前 的 投资 。 


基于 SAN 的 各 种 优点 ， 它 主要 用 于 仓储 量 大 的 工作 环境 (如 ISP、 银 行 等 ) ， 其 应 用 主要 归纳 为 : 构造 集群 环境 ， 利 用 存储 局 域 网 可 以 很 方便 地 通过 FC 把 
各 种 服务 器 、 人 存储 设备 连接 在 一 起 构成 一 个 具有 高 性 能 、 高 数据 可 用 性 和 扩展 性 强 的 集群 环境 ; 可 以 做 到 无 服务 器 的 数据 备份 ， 数 据 也 可 以 以 后 人 台 的 方式 在 
SAN 上 传递 ， 大 大 减少 了 网 络 和 服务 器 上 的 负载 ， 因 此 可 以 很 方便 地 实现 诸如 磁盘 几 余 、 天 键 数据 备份 、 远 程 集群 、 远 程 镜像 等 许多 防止 数据 丢失 的 数据 保护 
技术 ; 可 以 方便 地 进行 两 个 存储 设备 之 间 的 数据 迁移 以 及 远程 灾难 恢复 。 从 1999 年 开始 ，EMC、IBM、Compaq、Sun、HP 等 公司 相继 推出 自己 的 SAN 产 
品 。 近 年 来 ，SAN 技 术 得 到 了 长 足 发 展 。 


4. 基 于 IP 的 存储 区 域 网 络 (IP SAN) 
传统 SAN 的 互联 技术 是 Fiber Channel (FC) ， 但 是 其 在 实现 成 本 、 设 备 的 互 操作 性 、 跨 越 的 地 理 距 离 等 方面 阻碍 了 SAN 的 发 展 。 同 时 ， 远 程 数据 备份 、 


容错 、 灾 难 恢复 等 应 用 的 发 展 也 要 求 SAN 跨 越 的 距离 越 来 越 远 ， 因 此 传统 的 SAN 环 境 已 无 法 满足 当前 应 用 的 发 展 。 为 了 寻求 一 种 比较 经 济 而 又 能 够 实现 SAN 存 
储 的 高 性 能 的 存储 方式 ， 人 们 开始 探索 IP 网 络 技术 和 和 SAN 结合 ， 于 是 IP SAN 出 现 了 。 


IP SAN 是 基于 IP 网 络 实现 数据 块 级 别 存储 方式 的 存储 网 络 ， 是 一 种 将 存储 设备 、 连 接 设备 和 接口 集成 在 一 个 高 速 网 络 中 的 技术 。 它 可 以 利用 现成 的 网 络 染 
构 、 协 议 、 标 准 、 基 础 设施 和 管理 工具 ， 在 一 定 程度 上 解决 SAN 存 在 的 高 成 本 和 难 管理 的 缺陷 。 


与 传统 的 FC SAN 相 比 ，IP SAN 有 其 优势 ， 也 有 它 的 不 足 。 其 优势 主要 体现 在 以 下 几 点 : 基于 成 熟 的 IP 技 术 ， 在 一 定 程度 上 保护 了 现 有 资产 ， 降 低 了 配 
置 、 维 护 、 管 理 方面 的 复杂 度 ; IP 存 储 超越 了 地 理 距 离 的 限制 ， 大 大 延伸 了 传统 并 行 SCSI 存 储 的 距离 限制 ;可 以 预期 的 10Gbit/s 以 太 网 的 推出 将 极 大 地 改善 IP 
存储 的 服务 性 能 。 


IP SAN 的 不 足 主 要 有 以 下 几 点 :IP 存储 的 产品 总 体 上 还 不 成 熟 ， 用 户 可 选择 余地 较 小 ; 目前 IP SAN 的 实现 还 比较 困难 ， 需 要 一 些 专门 的 驱动 设备 和 相关 
知识 的 帮助 ; 由 于 IP 网 络 尤其 是 以 太 网 本 身 的 效率 较 低 ， 因 此 IP 存 储 比 较 消耗 系统 资源 。 


目前 主流 的 基于 IP 的 存储 方案 包括 互联 网 小 型 计算 机 系统 接口 (internet Small Computer System Interface，iSCSI) 、 互 联网 光纤 通道 协议 (internet 
Fiber Channel Protocol，iFCP) 和 基于 IP 的 光纤 通道 (FCIP) 方案 。 这 三 种 IP 存 储 方案 都 有 成 本 低 、 灵 活性 强 、 可 管理 性 好 、 距 离 适 中 以 及 对 以 大 网 技术 有 
良好 支持 的 特点 。 


5. 基 于 lnfiniBand 的 SAN 存 储 系统 (IBSAN) 


InfiniBand (IB) 是 在 1999 年 由 FuturelO 和 NGIO 两 个 标准 整合 而 来 的 ， 它 主要 用 于 服务 器 、 存 储 设备 等 网 络 设备 间 的 连接 。1InfiniBand 是 一 种 交换 结构 
I/O 技 术 ， 其 设计 思路 是 通过 一 套 中 心机 构 (中 心 InfiniBand 交 换 机 ) 在 远程 存储 器 、 网 络 以 及 服务 器 等 设备 之 间 建 立 一 个 单一 的 连接 链 路 ， 并 由 中 心 
InfiniBand 交 换 机 来 指挥 流量 ， 它 的 结构 设计 得 非常 泽 密 ， 大 大 提高 了 系统 的 性 能 、 可 靠 性 和 有 效 性 ， 能 缓解 各 硬件 设备 之 间 的 数据 流量 拥塞 。 


1BSAN 是 一 种 将 InfiniBand 和 SAN 技 术 相 结合 的 存储 系统 方案 。1BSAN 采 用 层次 结构 ， 将 系统 的 构成 与 接 入 设备 的 功能 定义 分 开 ， 不 同 的 主机 可 通过 
HCA (Host Channel Adapter， 主 通道 适配器 ) 、RAID 等 网 络 存储 设备 利用 TCA (Target Channel Adapter， 目 标 通道 适配器 ) 接 入 IBSAN。 如 图 1-9 所 
示 ，|BSAN 由 处 理 节点 (服务 器 ) 、InfiniBand 通 信和 网 、I/O 节 点 和 存储 设备 组 成 。 其 中 人 处理 节点 提供 一 个 或 多 个 InfiniBand 的 HCA，HCA 是 主机 的 
IBA (InfiniBand Architecture) 接口 ， 完 成 报 文 的 收 友 并 实现 IBA 所 确定 的 各 种 功能 。InfiniBand 通 信和 网 包括 交换 机 和 路 由 器 ， 连 接 处 理 忆 点 、|/O 节 点 和 和 存 
储 设备 。1/O 节 点 是 市 目标 通道 适配器 (TCA) 接口 的 各 种 MO 设备 。TCA 是 1/O 设 备 的 1BA 接 口 ， 完 成 报 文 的 收发 并 实现 1BA 所 确定 的 各 种 功能 。 人 存储 设备 包括 
磁盘 阵列 、 磁 带 库 等 。 

InfiniBand 体 系 结构 将 IP 网 络 和 存储 网 络 合 二 为 一 ， 以 交换 机 互 连 和 路 由 器 互 连 的 方式 支持 系统 的 可 扩展 性 。 服 务 器 端 通 过 HCA 连 接 到 主机 内 存 总 线 上 ， 


突破 了 PCI 的 融 宽 限制 ， 存 储 设备 端 通 过 TCA 连 接 到 物理 设备 上 ， 突 破 了 SCSI 和 FCIP 的 芝 宽 限制 。InfiniBand 技 术 目 前 主要 被 数据 中 心 、 服 务 提供 商 和 集群 所 
采用 。 随 着 网 络 存储 的 高 速 友 展 ，InfiniBand 作 为 新 一 代 的 SAN 互 联 技术 ， 将 显示 出 强大 的 生命 力 和 市 场 应 用 前 景 。 
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图 1-9 IBSAN 系 统 结构 


1.4.2 分布 式 存储 


分 布 式 存储 系统 是 将 数据 存储 在 多 个 特定 的 节点 上 ， 通 过 网 络 使 用 系统 中 的 各 个 节点 上 的 磁盘 空间 ， 并 将 这 些 分 散 的 资源 构成 一 个 虚拟 的 存储 设备 。 传 统 
的 网 络 存储 系统 采用 集中 的 存储 服务 器 存放 所 有 数据 ， 存 储 服务 器 成 为 系统 性 能 的 瓶 贷 ， 也 是 可 靠 性 和 安全 性 的 焦点 ， 不 能 满足 大 规模 存储 应 用 的 需要 。 分 布 
式 网 络 存 储 系统 采用 可 扩展 的 系统 结构 ， 利 用 多 台 存 储 服务 器 分 担 存 储 负 谷 ， 利 用 位 置 服务 器 定位 存储 信息 ， 它 不 仅 提 高 了 系统 的 可 靠 性 、 可 用 性 和 存 取 效 


率 ， 还 易于 扩展 。 近 年 来 ， 国 内 外 很 多 机 构 结合 自身 需要 开发 了 一 些 各 具 特 色 的 分 布 式 文件 系统 。 下 面 简要 介绍 几 个 分 布 式 文件 系统 。 
1:PVES 


PVFS (Parallel Virtual File System， 并 行 虚拟 文件 系统 ) 是 Clemson 大 学 开 友 的 高 性 能 、 可 扩展 的 分 布 式 并 行文 件 系 统 。 它 无 须 特殊 的 硬件 设备 或 内 核 
支持 ， 可 以 直接 在 普通 的 PC 上 运行 。 目 前 ,很 多 流行 的 分 布 式 文件 系统 都 借鉴 了 PVFS 的 设计 思想 。 


PVFS 由 一 个 管理 节点 、 多 个 |/O 节 点 和 若干 个 计算 节点 组 成 ， 可 以 将 整个 分 布 式 文件 系统 的 元 数据 信息 以 及 目录 层次 结构 存放 在 管理 节点 上 ， 实 现 了 统一 
的 命名 空间 ， 兼 容 了 现 有 文件 系统 的 访问 方式 ， 并 提供 了 更 高 性 能 的 数据 访问 方式 。 


PVFS 也 有 很 多 不 足 之 处 。 首 先 ， 它 只 提供 单一 的 管理 节点 。 当 管理 节点 由 于 异常 而 无 法 正常 工作 时 ， 整 个 分 布 式 文件 系统 束 会 立刻 停止 服务 。 当 分 布 式 
文件 系统 达到 一 定 规模 后 ， 管 理 节 点 很 容易 成 为 系统 找 贷 。 另 外 ，PVFS 对 数据 的 存储 缺乏 容错 机 制 ， 当 某 I/O 节 点 无 法 工作 时 ， 和 存储 在 该 节点 上 的 数据 将 会 永 
久 丢 失 。 最 后 ， 其 配置 不 够 灵活 ， 无 法 在 PVFS 运 行 时 修改 系统 配置 信息 、。 


2.Google FS 


Google FS 是 Google 公 司 为 了 满足 其 应 用 需求 而 开发 的 面向 大 规模 数据 密集 型 应 用 的 、 可 伸缩 的 、 基 于 Linux 的 专 有 分 布 式 文件 系统 ， 可 以 应 用 在 大 文 
件 、 连 续 读 、 不 修改 、 高 并 上 友 的 仓储 场景 。 它 运行 在 廉价 的 普遍 硬件 设备 上 ， 并 且 提 供 了 有 效 的 灾难 元 余 能 力 ， 可 以 为 大 量 客户 机 提供 高 性 能 的 存储 服务 。 另 
外 ，Google FS 还 使 用 了 一 个 宽松 的 一 致 性 模型 ， 不 但 能 很 好 地 支持 高 度 分 布 式 应 用 ， 而 且 实 现 起 来 也 相对 简单 和 有 效 。 


Google FS 虽然 具有 简洁 、 可 靠 、 高 性 能 的 优点 ， 但 是 为 此 Google FS 也 付出 了 一 定 的 代价 。 首 先 ， 中 心服 务 器 模式 虽然 处 理 逻 辑 很 简单 ， 但 是 它 有 一 些 
固有 的 缺 操 ， 比 如 极 易 成 为 整个 系统 的 瓶颈 ， 其 次 ，Google FS 完全 及 用 副本 策略 进行 元 余 以 提高 系统 的 可 靠 性 ， 因 此 会 消耗 更 多 的 原始 存储 。 最 后 ，64MB 
的 存储 单元 (chunk) 大 小 虽然 有 利于 降低 网 络 开 销 、 减 少 系统 负载 ， 但 是 有 的 小 文件 可 能 只 有 一 个 或 者 几 个 chunk， 这 样 那些 存储 了 这 些 chunk 的 


chunkserver ( 块 服务 器 ) 节点 就 会 很 容易 变 成 热点 。 
3.HDFS 


HDFS (Hadoop Distributed File System) 是 一 个 基于 Java、 支 持 数 据 密集 型 应 用 、 高 度 容错 、 具 有 高 吞吐 量 的 分 布 式 文件 系统 ， 它 能 够 保证 应 用 程序 
可 以 在 成 百 上 干 个 低 成 本 的 商用 硬件 上 存储 和 处 理 PB 级 的 数据 。 为 了 实现 流 式 读 取 文件 系统 数据 的 目标 ，HDFS 放 宽 了 对 POSIX 语 义 的 要 求 ， 从 而 适用 于 批量 
数据 的 处 理 。HDFS 作 为 一 个 开源 项 目 ， 受 到 了 Google FS 很 大 启发 ， 目 前 已 经 在 各 大 互联 网 公司 得 到 了 广泛 的 应 用 ， 百 度 、 腾 讯 等 公司 都 将 HDFSs 作 为 底层 存 
储 架 构 。 


HDFS 是 一 个 不 错 的 分 布 式 文件 系统 ， 它 有 很 多 优点 ， 但 也 存在 一 些 缺点 。 首 先 ，HDFS 不 太 适合 于 那些 要 求 低 延 时 数据 访问 的 应 用 程序 。 因 为 HDFS 主 要 
目的 是 处 理 大 型 数据 分 析 任务 ， 是 为 达到 高 的 数据 吞吐 量 而 设计 的 ， 这 就 可 能 要 求 以 高 延迟 作为 代价 。 其 次 ， 其 无 法 高 效 存储 大 量 小 文件 。 因 为 Namenode 
把 文件 系统 的 元 数据 放置 在 内 存 中 ， 所 以 文件 系统 所 能 容纳 的 文件 数目 由 Namenode 的 内 存 大 小 来 决定 。 最 后 ，HDFS 不 支持 多 用 户 写 入 及 任意 修改 文件 ， 在 
HDFS 的 一 个 文件 中 只 有 一 个 写 入 者 ， 而 且 写 操作 只 能 在 文件 未 尾 完成 ， 即 只 能 执行 追加 操作 。 


4.Ceph 


Ceph 是 一 个 新 兴 的 分 布 式 文件 系统 ， 它 的 原型 是 一 项 关于 存储 系统 的 PhD 研 究 项 目 ， 由 加 利 福 尼 亚 大 学 的 Sage Weil 在 2007 年 提出 。Ceph 架 构 设 计 的 首 
要 目标 是 高 可 扩展 性 (系统 存储 量 达到 数 百 PB 级 别 以 上 ) 、 高 性 能 和 高 可 靠 性 。Ceph 是 开源 的 ， 遵循 LGPL 协 议 。Ceph 的 第 一 个 版 本 在 2012 年 6 月 发 布 , 但 
是 束 目 前 的 情况 而 言 ，Ceph 无 论 从 架构 还 是 其 工程 实现 上 来 看 都 不 太 成 熟 ， 难 以 在 生产 环境 中 使 用 。 


Ceph 最 大 的 特点 是 分 布 式 元 数据 服务 器 通过 CRUSH， 即 一 种 拟 算法 来 分 配 文件 的 位 置 ， 其 核心 是 RADOS (Reliable Automatic Distributed Object 
storage) ， 即 一 个 对 缚 集群 存储 ， 本 身 提供 对 象 的 高 可 用 、 错 误 检测 和 修复 功能 ,解决 了 关于 扩展 性 方面 的 三 个 问题 : 动态 分 布 式 元 数据 管理 、 解 耦 数 据 和 
元 数据 ， 以 及 可 靠 自 治 的 分 布 式 对 象 存储 。 


5.BWFS 


BWFS (Blue Whale File System， 蓝 鲸 文件 系统 ) 是 国家 高 性 能 计算 机 工程 技术 研究 中 心 承担 的 国家 “863” 重 点 支持 课题 研究 成 果 得 到 的 产物 。BWFS 
采用 集群 技术 ， 利 用 大 量 计算 机 组 成 一 个 集群 体系 结构 ， 以 此 提供 高 性 能 计算 能 力 和 数据 传输 效率 。 虽 然 BWFS 借 鉴 了 国外 一 些 技 术 ， 但 有 自己 的 创新 。 蓝 鲸 
文件 系统 采用 了 新 型 结构 、 网 络 可 扩展 体系 结构 ， 并 且 采 用 虚拟 存储 技术 将 多 个 存储 设备 上 的 资源 合并 成 统一 的 存储 空间 ， 进 行 高 效 数据 管理 。BWFS 目 前 在 
石油 勘探 处 理 、 信 息 检 索 与 处 理 、 数 字 媒体 、 遥 感 、 高 能 物理 研究 等 领域 有 广泛 的 应 用 ， 为 我 国 工业 、 国 防 、 科 技 发 展 做 出 很 大 贡献 。BWFS 的 后 续 系 统 也 一 
直 在 研究 中 ， 相 信 我 国 自主 开发 的 分 布 式 系统 能 够 为 国家 做 出 更 大 贡献 。 


1.5 ”大 数据 时 代 下 的 新 兴 存 储 技术 


数据 存储 领域 正在 友 生 着 剧烈 的 变化 ， 而 且 这 种 变化 将 是 长 期 的 趋势 。 随 着 数据 存储 领域 的 变化 ， 必 然 会 催生 一 些 新 的 技术 ， 以 改变 存储 领域 的 友 展 。 
1. 以 太 网 硬盘 


以 太 网 硬盘 是 希捷 公司 最 先 提出 的 ， 该 公司 宣称 以 太 网 硬盘 较 现 存 硬 盘 将 提供 可 能 高 达 四 售 的 存储 应 用 性 能 。 以 太 网 硬盘 的 设计 思路 是 精简 数据 到 硬盘 之 
间 的 传输 环节 ( 即 数据 无 需 从 服务 器 到 HBA 卡 再 到 阵列 控制 器 最 后 被 写 到 硬盘 中 ， 在 以 太 网 硬盘 的 系统 中 ， 数 据 可 以 直接 经 网 络 到 硬盘 的 以 太 网 接口 进而 存 进 
硬盘 中 ) 。 以 太 网 硬盘 的 优势 非常 明显 ,但 是 同样 也 面临 着 非常 多 的 挑战 ， 目 前 推出 以 太 网 硬盘 的 厂商 有 希捷 和 HGST。 


2. 氨 气 填 充 磁盘 ( 充 氨 磁 盘 ) 


湖 
法 


首 款 充 氨 磁盘 由 HGST 公 司 推出 ， 容 量 为 6TB， 是 一 种 填充 氨 气 的 存储 器 。 这 革 产 品 的 好 处 是 能 够 使 用 更 多 的 旋转 盘 片 驱动 器 增加 产品 性 能 ， 而 且 气 提供 
更 小 的 阻力 以 防止 盘 片 因为 过 多 摩擦 导致 更 多 的 热量 消耗 。 


3. 相 变 存储 器 


相 变 存储 器 简称 PCM ， 其 利用 特殊 材料 在 晶 态 和 非 晶 态 之 间 相 互 转 化 时 所 表现 出 来 的 导电 性 差异 来 存储 数据 ， 通 音 利 用 硫 族 化 合 物 在 晶 态 和 非 晶 态 中 巨 
大 的 导电 性 差异 。2015 年 《自然 :光子 学 》 杂 志 公 布 了 世界 上 第 一 个 或 可 长 期 存储 数据 且 完 全 基于 光 的 相 变 存储 器 。 


4. 遗 传 存 储 


哈佛 大 学 研究 人 员 将 一 本 大 约 有 5.34 万 个 单词 的 书籍 编码 进 不 到 一 沙 克 〈 即 亿 万 分 之 一 克 ) 的 DNA 微 已 片 中 ， 然 后 成 功利 用 DNA 测 序 来 阅读 这 本 书 。 这 
是 迄今 为 止 人 类 使 用 DNA 遗 传 物质 存储 数据 量 最 大 的 一 次 实验 。DNA 分 子 也 是 非常 致密 的 存储 介质 ，1 克 DNA 能 够 保存 2000TB 数 据 。 


1.6 存储 系统 的 逻辑 构成 


存储 系统 是 用 来 保存 数据 ， 并 能 够 按照 用 户 请 求 提供 相应 数据 的 一 组 部 件 。 它 不 但 负责 数据 的 读 / 写 请 求 ， 也 负责 数据 的 传输 。 如 图 1-10 所 示 ， 人 存储 系统 
由 主机 系统 、 互 联 部 件 和 存储 设备 三 部 分 组 成 。 


操作 系统 


注 洪 尘 册 





互联 部 件 (PCI、IDE/ATA、 
SCSI 和 USB 等 接口 协议 ) 





图 1-10 ”存储 系统 组 成 


1.6.1 主机 系统 


主机 系统 负责 完成 操作 系统 和 需要 数据 的 应 用 之 间 的 交互 ， 并 完成 数据 的 读 / 写 请 求 。 从 结构 上 看 ， 主 机 系统 可 分 为 物理 部 件 和 逻辑 部 件 。 


主机 的 物理 部 件 是 由 中 央 处 理 单元 (CPU) 、 人 存储 设备 和 输入 输出 设备 组 成 ， 如 图 1-11 所 示 ， 三 者 通过 总 线 或 者 通信 线路 连接 起 来 。 中 央 处 理 单元 包括 算 
术 人 逻辑 单元 、 寄 存 器 组 和 1 级 高 速 组 站 寄存 器 。 和 存储 设备 由 半导体 存储 器 或 者 光盘 、 磁 盘 等 存储 器 组 成 ， 负 责 数据 的 存储 。 输 入 输出 设备 主要 负责 主机 与 外 部 
发 送 和 接收 数据 ， 包 括 键盘 、 鼠 标 、USB、 主 机 总 线 适 配器 (HBA) 等 。 


主机 的 逻辑 部 件 主要 由 系统 软件 和 协议 组 成 ， 它 们 实现 了 与 用 户 数据 的 交互 ， 主 要 的 逻辑 部 件 包 括 操作 系统 、 设 备 驱动 、 文 件 系统 以 及 应 用 程序 。 其 中 ， 
应 用 程序 为 用 户 与 主机 间或 主机 与 其 他 系统 间 提 供 交 互 点 。 


总 线 





输入 输出 设备 





图 1-11 主机 的 物理 部 件 


操作 系统 控制 计算 机 环境 的 各 个 方面 ， 它 工作 在 应 用 程序 和 计算 机 物理 部 件 乙 间 ， 为 应 用 程序 提供 数据 访问 接口 ， 同 时 也 对 用 户 的 行为 进行 监视 和 响应 。 
操作 系统 组 织 和 控制 着 物理 资源 的 分 配 ， 并 对 资源 访问 和 使 用 提供 基本 安全 保障 。 其 企管 理 其 他 底层 资源 如 文件 系统 和 设备 驱动 的 同时 ， 也 担当 基本 存储 管理 
的 任务 。 


设备 驱动 是 一 种 特殊 的 软件 ， 是 操作 系统 和 输入 输出 设备 间 的 黏合 剂 。 设 备 驱动 负责 将 操作 系统 的 请 求 传输 、 转 化 为 特定 物理 设备 的 控制 器 能 够 理解 的 命 
令 。 设 备 驱 动 是 硬件 相关 的 ， 且 与 操作 系统 紧密 天 联 。 


文件 系统 是 一 个 有 关联 天 系 的 记录 或 数据 的 集合 ， 它 们 作为 一 个 整体 存储 在 一 起 。 一 个 文件 系统 就 是 大 量 文 件 的 分 层 组 织 结 构 ， 它 需要 基于 主机 的 逻辑 结 
构 和 控制 读 / 写 存储 软件 例 程 来 控制 对 文件 的 存 取 。 文 件 系统 通过 使 用 目录 把 数据 组 织 成 分 层 结 构 ， 当 用 户 试 图 通过 文件 名 访 间 特定 文件 时 ， 通 过 该 名 称 在 目 
录 中 查找 相应 文件 入 口 ， 并 在 入 口 处 获得 具体 的 元 数据 。 常 见 的 文件 系统 有 FAT32、NTFS、UFS、EXT 等 ， 在 后 续 章 节 会 进行 详细 介绍 。 文 件 系 统 可 以 根据 是 
否 保 存 日 志 分 为 无 日 志文 件 系统 和 有 日 志文 件 系统 。 因 为 更 新 数据 和 元 数据 可 能 会 使 用 许多 独立 的 写 操作 ， 因 此 无 日 志文 件 系 统 可 能 会 造成 文件 的 丢失 。 有 日 
志文 件 系 统 使 用 一 个 独立 的 日 志 区 域 保存 运行 记录 。 日 志 可 以 保存 所 有 写 操作 的 数据 和 将 要 更 新 的 元 数据 ， 在 对 文件 系统 修改 之 前 ， 这 些 修改 先 写 入 独立 的 日 
志 区 。 只 有 人 在 日 志 区 被 更 新 后 ， 操 作 才 能 进行 。 如 果 在 操作 过 程 中 友 生 障碍 ， 可 通过 日 志 信 息 恢复 相应 的 操作 。 通 过 日 志方 式 可 以 快速 检查 文件 系统 操作 ， 大 
大 降低 文件 丢失 的 可 能 性 。 


1.6.2 ” 互 连 方 式 
互 连 是 指 主机 之 间或 者 主机 同 其 他 外 围 设备 之 间 的 连接 ， 包 括 连 接 主机 和 存储 设备 的 物理 部 件 和 用 于 主机 和 存储 设备 之 间 的 通信 协议 。 


连接 主机 和 和 存储 设备 的 三 个 物理 部 件 是 思 线 、 端 口 和 线 绕 ， 如 图 1-12 所 示 。 


亲口 





图 1-12 ”物理 连接 部 件 


忌 线 是 实现 计算 机 各 个 部 件 直接 进行 数据 传输 的 一 组 数据 通路 集合 。 端 口 是 专用 插口 ， 使 得 主机 和 外 部 设备 之 间 可 以 建立 连接 。 线 缆 用 于 连接 主机 和 内 部 
或 外 部 设备 ， 主 要 由 铜 或 光纤 制 成 。 


物理 部 件 通过 总 续 在 设备 乙 间 友和 送 数据 包 来 进行 相互 通信 ， 这 些 数据 包 通 过 串 行 或 并 行 的 方式 被 传送 。 在 串 行 通信 中 ， 各 位 按 顺 序 进 行 传输 ;在 并 行 通 信 
中 ， 各 位 同时 在 多 个 通路 中 进行 传输 。 


计算 机 系统 中 的 总 线 大 致 可 分 为 两 种 ， 一 种 是 系统 总 线 ， 负 责 处 理 器 和 主 存 之 间 的 数据 传输 ， 另 一 种 是 局 部 总 线 ， 是 直接 连接 到 处 理 器 的 高 速 通路 。 


位 宽 是 总 绪 的 非常 重要 的 指标 ， 决 定 了 一 次 可 以 传送 的 数据 量 。 例 如 ，32 位 的 总 绪 能 并 行 传输 32 位 数据 ， 而 64 位 总 线 能 并 行 传递 64 位 数据 。 辟 线 以 MHz 
作为 衡量 速度 的 指标 ， 总 线 传输 率 越 快 ， 主 机 对 存储 设备 的 存 取 效 率 越 高 。 


通信 协议 是 指定 义 好 的 通信 格式 和 交互 约定 ， 使 得 友 送 方 和 接收 方 设备 能 够 按 约定 的 方式 进行 通信 。 用 于 局 部 忌 线 和 内 部 磁盘 系统 互 连 的 协议 主要 包括 
PCI、1IDE/ATA 和 SCSI。 及 用 闪存 (主要 为 NAND Flash 心 片 ) 作为 存储 介质 时 ， 与 主机 通信 时 主要 采用 USB、SATA 等 接口 协议 。 下 面 对 各 个 接口 协议 作 简 要 
介绍 ， 而 对 于 各 个 接口 协议 的 详细 内 容 也 会 在 后 续 章 忆 进行 介绍 。 


PCIl 是 局 部 忌 线 连接 外 设 一 般 采 用 的 接口 协议 ， 它 规定 了 PCI 扩 充 卡 (如 了 网卡 或 调制 解 调 器 ) 与 CPU 如 何 交 换 信息 ， 同 时 也 提供 了 CPU 与 附加 设备 之 间 的 
互 连 。PCI 协 议 具有 即 插 即 用 功能 ， 使 得 主机 对 新 卡 和 设备 能 够 容易 地 进行 识别 和 配置 ， 它 可 以 进行 32 位 或 者 64 位 的 数据 传输 ， 可 以 达到 133MB/s 的 吞吐 量 。 


IDE/ATA 协 议 是 现在 磁盘 常用 的 接口 协议 ， 该 协议 集成 电子 技术 和 高 级 互 连 技术 ， 具 有 低 成 本 、 高 性 能 的 特点 。 


SCSI 协 议 是 小 型 计算 机 系统 接口 协议 ， 在 高 端 计算 机 中 备 受 青睐 。 但 是 由 于 其 成 本 较 高 而 且 对 于 一 些 家 庭 和 企业 用 户 来 说 并 不 需要 ， 使 其 没有 IDE/ATA 协 
议 那样 流行 。SCS9I 协 议 能 够 把 设备 连接 到 主机 ， 并 且 采 用 并 行 的 方式 实现 多 个 数据 线 的 数据 传输 。 目 前 9CSI 得 到 了 很 大 的 招展， 涵盖 了 多 种 技术 和 标准 ， 我 们 


将 在 后 续 章 节 对 其 进行 详细 介绍 。 


SATA 是 一 种 完全 不 同 于 并 行 ATA 的 新 型 硬盘 接口 类 型 ， 由 于 采用 趾 行 方式 传输 数据 而 得 名 。SATA 辟 线 使 用 典 入 陈 时 钟 信号 ， 具 备 更 强 的 纠 错 能 力 ， 能 对 
传输 指令 (不 仅仅 是 数据 ) 进行 检查 ， 如 果 发 现 错误 会 自动 矫正 ， 这 在 很 大 程度 上 提高 了 数据 传输 的 可 靠 性 。 该 捉 行 接口 还 具有 结构 简单 、 支 持 热 揪 拔 的 优 


aA\o 


USB (Universal Serial Bus， 通 用 串 行 总 绪 ) 是 连接 计算 机 系统 与 外 部 设备 的 一 种 串口 轧 线 标准 ， 也 是 输入 输出 接口 的 一 种 技术 规范 ， 其 即 插 即 用 的 功能 


使 其 无 须 经 过 繁复 的 安装 程序 便 可 将 外 围 沪 置 进行 任意 连接 、 配 置 、 使 用 及 移 除 。 而 由 于 USB 的 弹性 与 容易 使 用 ， 其 被 广泛 地 应 用 于 个 人 计算 机 和 移动 设备 等 
| (机 顶 爹 ) 、 游 戏 机 等 其 他 相关 领域 。 


1.6.3 ”存储 器 层次 结构 


在 具体 的 存储 系统 中 ， 通 常 存在 着 不 同类 型 的 存储 设备 ， 它 们 在 容量 、 成 本 、 速 度 和 性 能 上 都 存在 很 大 的 差异 。 为 了 达到 用 尽 可 能 低 的 价格 提供 尽 可 能 高 
的 速度 和 尽 可 能 大 的 人 存储 容量 ， 人 存储 系统 采用 将 不 同 的 存储 器 组 合 起 来 ， 形 成 一 个 仔 储 器 层次 结构 。 如 图 1-13 所 示 ， 最 高 层 的 是 CPU 寄存 器 组 ， 由 编译 器 完成 
分 配 ， 传 送 速 度 同 处 理 器 速度 ， 主 要 存放 系统 当前 运行 中 最 常用 的 数据 ， 其 次 是 高 速 缓存 (Cache) ， 分 为 内 部 Cache 和 外 部 Cache 两 层 ， 用 来 存放 主人 存 中 的 
常用 数据 ， 由 存储 管理 单元 控制 ， 再 次 是 主 存储 器 ， 由 存储 管理 单元 和 操作 系统 共同 管理 ; 最 下 面 的 是 辅助 存储 器 ， 通 过 I/O 通 道 进行 存 取 并 提供 大 容量 和 非 
易 失 的 数据 存储 能 力 。 





辅助 存储 名 


图 1-13 ”存储 器 层次 结构 


广义 的 存储 系统 包括 CPU 中 的 寄存 器 、 多 级 Cache、 内 存 和 外 部 仓储 设备 ， 而 狭义 的 存储 系统 仅 包 含 外 部 存储 设备 。 在 本 书 中 ， 如 没有 特别 说 明 ， 存 储 系 
统一 般 是 指 狭义 的 存储 系统 。 相 对 于 内 存 ， 外 部 存储 设备 要 提供 大 容量 和 非 易 失 性 的 数据 存储 能 力 ， 从 而 保证 系统 在 断 电 或 者 意外 断 连 主机 的 情况 下 能 够 正确 
地 保存 数据 。 


随 着 互联 网 的 发 展 和 数据 信息 量 的 爆炸 式 增 长 ， 用 户 需 要 拥有 更 高 性 能 的 计算 机 存储 系统 。 然 而 传统 硬盘 由 于 其 机 械 结 构 的 存在 ， 存 取 速 度 远 远 跟 不 上 
Cache 和 主 存 ， 成 为 高 性 能 存储 系统 友 展 的 瓶 贷 。 而 新 兴 的 固态 硬盘 (SSD) 技术 日 益 成 熟 ， 由 于 其 具有 存储 速度 快 、 防 震 性 好 、 能 耗 小 、 噪 声 低 等 特 点 ， 固 
人 态 硬 盘 得 到 了 越 来 越 多 用 户 和 商家 的 青睐 。 目 前 有 三 种 利用 SSD 技 术 解 决 存储 结构 问题 的 方案 。 


第 一 种 方案 是 在 存储 系统 中 直接 用 SSD 取 代 传 统 硬盘 ， 该 方法 具有 性 能 好 、 省 电 、 无 需 修 改 存储 系统 结构 和 接口 的 优 息 ， 但 是 目前 造价 较 机 械 硬盘 仍 偏 
高 ， 适 合用 于 相对 高 端的 计算 机 .。 


第 二 种 方案 是 使 用 市 有 SSsD 的 改进 硬盘 ， 即 在 传统 机 械 硬 盘 上 安 半 快速 SSD 模 块 。 访 方案 性 价 比较 局、 磁盘 操作 简单 、 传 输 市 宽 遍 ， 但 是 改变 了 原 有 的 人 存 
储 系统 结构 ， 同 时 继承 了 传统 硬盘 的 一 些 缺 点 ， 如 抗 冲击 性 差 、 读 写 时 间 长 等 。 


第 三 种 方案 是 把 SSD 和 BIOS 心 片 二 合 为 一 。 该 方案 改变 了 存储 系统 结构 ， 性 能 更 好 ， 操 作 系 统 可 以 快速 开机 ， 存 取 速 度 快 ， 能 够 提高 整个 存储 系统 性 能 。 
但 是 此 方法 需要 改变 计算 机 系统 结构 ， 重 写 操作 系统 启动 程序 ， 因 此 目前 技术 上 还 不 太 成 熟 。 无 论 使 用 哪 种 方案 ，SSD 以 其 更 高 的 存 取 效率 和 更 好 的 稳定 性 ， 
势必 会 成 为 未 来 主流 的 存储 介质 之 一 。 
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第 2 草 文件 系统 


数据 存储 在 各 种 存储 介质 中 ， 那 么 用 户 是 如 何方 便 快捷 地 访问 存储 设备 中 数据 的 ?对 一 般 用 户 而 言 直 接 读 取 存储 介质 中 的 数据 并 将 数据 组 织 起 来 是 一 件 非 
常 困 难 的 事情 。 以 磁盘 为 例 ， 一 般 用 户 根 本 不 知道 如 何 驱 动 一 个 磁盘 ， 更 不 知道 数据 在 磁盘 上 的 存放 位 置 及 组 织 方式 ， 让 其 了 解 所 有 的 技术 细节 将 使 用 户 不 堪 
重负 。 从 1.6 节 的 介绍 我 们 知道 ， 操 作 系 统 为 用 户 提供 了 硬件 抽象 模型 ， 用 户 通过 操作 系统 可 以 方便 地 使 用 硬件 资源 ， 而 无 项 了 解 硬件 的 扩 术 细节 而 操作 系 
统 中 的 文件 系统 是 解决 如 何在 存储 设备 上 存储 数据 的 一 套 方法 ， 包 括 存 储 布局 、 文 件 命 名 、 空 间 管 理 、 安 全 控制 等 ， 当 用 户 使 用 文件 系统 访问 存储 介质 中 的 数 
据 时 ， 不 必 关 心 数据 保存 在 存储 设备 中 的 实际 物理 地 址 ， 通 过 文件 的 所 属 目录 和 文件 名 即 可 定位 到 该 文件 。 


从 系统 角度 来 看 ， 文 件 系统 是 对 文件 存储 器 空间 进行 组 织 和 分 配 、 负 责 文 件 存储 并 对 存 入 的 文件 进行 保护 和 检索 的 系统 。 具 体 地 说 ， 它 负责 为 用 户 建 立 文 
件 ， 存 入 、 读 出 、 修 改 、 转 储 文件 ， 控 制 文件 的 存 取 ， 当 用 户 不 再 使 用 时 撤销 文件 等 。 在 通常 情况 下 ， 文 件 系 统 由 三 部 分 组 成 : 与 文件 管理 有 关 的 软件 、 被 管 
理 文 件 和 实施 文件 管理 所 需 的 数据 结构 。 


本 章 对 一 些 常 见 的 文件 系统 如 FAT、EXT、NTFS、CDFS 等 进行 了 介绍 ， 对 于 在 固态 存 储 设备 中 使 用 的 专用 文件 系统 如 JFFS、YAFFS、UBIFS 和 exFAT 将 


在 第 6 章 介 绍 。 


2.1 FAT 


FAT 的 全 称 是 文件 分 配 表 (File Allocation Table) ， 是 Windows 操 作 系 统 上 常见 的 一 种 文件 系统 。FAT 文 件 系 统 起 源 于 20 世 纪 70 年 代 未 80 年 代 初 ， 是 由 
微软 公司 发 明 并 拥有 部 分 专利 的 文件 系统 ， 用 于 MS-DOS， 也 是 所 有 非 NT 核心 的 Windows 版 本 使 用 的 文件 系统 。 当 时 计算 机 性 能 有 限 ， 因 而 FAT 被 设计 为 一 
个 相对 简单 的 文件 系统 ， 用 于 容量 小 于 500KB 的 软盘 。 后 来 随 着 计算 机 硬件 处 理 能 力 和 存储 容量 的 友 展 ，FAT 的 功能 也 在 不 断 改 进 中 ， 目 前 已 经 可 以 支持 大 容 
量 的 存储 介质 。FAT 的 上 发展 过 程 经 历 了 FAT12、FAT16、FAT32 三 个 阶段 ， 这 三 种 文件 系统 的 主要 区 别人 在 于 FAT 项 占据 的 位 数 不 同 。 


2.1.1 FAT 的 友 展 概况 


FAT 文 件 系 统 的 最 初版 本 是 FAT12。FAT12 采 用 12 位 文件 分 配 表 ， 并 因此 而 得 名 ， 在 DOs3.0 以 前 使 用 ， 可 以 管理 的 磁盘 分 区 容量 不 超过 8MB。 应 该 说 在 
当时 ， 这 个 容量 上 限 还 是 适用 的 ， 但 以 现在 的 眼光 来 看 则 已 经 过 时 了 。 


早 在 DOS2.0 被 广泛 应 用 期 间 ， 对 更 大 容量 的 磁盘 管理 能 力 的 需求 束 出 现 了 ， 所 以 在 DOS3.0 版 本 中 微软 推出 了 新 的 文件 系统 FAT16。 除 了 及 用 16 位 的 分 区 
表 之 外 ，FAT16 和 FAT12 和 在 其 他 地 方 都 非常 相似。 实际 上 ， 随 着 字 长 增加 4 位 ， 可 以 使 用 的 复 的 总 数 增加 到 了 65546。 在 FAT16 中 ， 当 复 的 总 数 小 于 4096 的 时 
候 ， 还 是 使 用 FAT12 的 分 区 表 ; 当 需 要 超过 4096 的 时 候 才 使 用 FAT16。 早 期 的 FAT16 文 件 系统 管理 磁盘 的 能 力 上 限 是 32MB，1987 年 DOS4.0 之 后 的 FAT16 可 
以 管理 128MB 的 磁盘 。 之 后 这 个 数字 不 断 扩 大， 一 直到 2GB。 在 整整 10 年 中 ，2GB 的 磁盘 管理 能 力 都 是 大 大 超过 实际 需要 的 。 


FAT16 分 区 格式 存在 严重 的 缺点 : 大 容量 磁盘 利用 效率 低 。 在 微软 的 DOS 和 Windows 系 列 中 ， 磁 盘 文 件 分 配 以 艇 为 单位 ， 一 个 簇 只 能 分 配给 一 个 文件 使 
用 ,不 管 这 个 文件 占用 整个 艇 容 量 的 多 少 。 这 样 ， 即 使 一 个 很 小 的 文件 也 要 占用 一 个 艇 ， 算 余 的 空间 便 全 部 闲置 ， 造 成 磁盘 空间 的 瀛 费 。 由 于 分 区 表 容量 的 限 
制 ，FAT16 分 区 创建 得 越 大 ， 磁 盘 上 每 个 禾 的 容量 也 越 大 ， 从 而 造成 的 滔 费 也 越 大 。 为 了 解决 这 个 问题 ， 微 软 推出 了 一 种 全 新 的 磁盘 分 区 格式 FAT32， 并 在 
Windows95OSR2 及 以 后 的 Windows 版 本 中 提供 支持 。 


FAT32 采 用 32 位 的 文件 分 配 表 ， 磁 盘 的 管理 能 力 大 大 增强 ， 突 破 了 FAT16 的 2GB 分 区 容量 限制 。FAT32 刚 刚 推 出 时 ， 主 流 硬 盘 的 存储 容量 并 不 大 ， 所 以 和 
软 设计 的 FAT32 可 以 应 用 在 一 个 不 超过 8GB 的 分 区 中 。FAT32 分 区 格式 的 每 个 艇 都 国定 为 4KB， 与 FAT16 相 比 ， 大 大 减少 了 磁盘 空间 的 浪费 ， 提 高 了 磁盘 的 利 
用 率 。 


2.1.2 ”FAT 的 重要 概念 


太刀 


1. 族 


FAT 文 件 系统 用 “ 禾 ” 作 为 数据 单元 ， 这 意味 着 一 个 文件 占据 存储 空间 的 大 小 必须 是 簇 的 整数 倍 。 艇 由 一 组 连续 的 扇 区 组 成 ， 所 含 的 肩 区 数 必须 是 2 的 整 
数 次 贿 。 复 的 最 大 值 为 64 个 扇 区 ， 即 最 大 的 篮 大 小 是 32KB。 所 有 篮 从 2 开始 进行 编号 ， 每 个 禾 都 有 一 个 自己 的 地 址 编号 。 之 所 以 以 篮 为 单位 而 不 以 肩 区 为 单位 
进行 磁盘 的 分 配 ， 是 因为 当 分 区 容量 较 大 时 ， 采 用 大 小 为 512B 的 扇 区 管理 会 增加 FAT 表 的 项 数 ， 对 大 文件 仓 取 增 加 消耗 ， 文 件 系统 效率 不 局 。 


2 文件 分 配 表 和 目录 项 
FAT 文 件 系统 有 两 个 重要 的 数据 结构 : 文件 分 配 表 和 目录 项 。 其 中 文件 分 配 表 就 是 英文 缩写 “FAT” 的 中 文 译名 ， 
FAT 文 件 系统 的 每 一 个 文件 和 文件 夹 都 被 分 配 到 一 个 目录 项 ， 目 录 项 中 记录 着 文件 名 、 大 小 、 文 件 内 容 起 始 地 址 以 及 其 他 一 些 元 数据 。 


文件 和 文件 夹 内 容 存 储 在 “ 艇 ”中 。 如 果 一 个 文件 或 文件 夹 需要 更 多 的 艇 ， 则 用 文件 分 配 表 (FAT) 来 描述 如 何 找 到 另外 的 艇 。 文 件 分 配 表 用 于 指出 文件 
的 下 一 个 艇 ,同时 也 说 明了 艇 的 分 配 状 态 。 


目录 项 结构 、 艇 和 文件 分 配 表 结 构 之 间 的 关系 如 图 2-1 所 示 。 
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图 2-1 目录 项 、 和 化 和 文件 分 配 表 结构 之 间 的 关系 


一 个 文件 的 起 始 艇 号 记录 在 它 的 目录 项 中 ， 该 文件 的 其 他 艇 则 用 一 个 簇 链 结构 记录 在 文件 分 配 表 中 。 如 果 要 寻找 文件 的 下 一 艇 ， 只 需要 查看 该 文件 的 目录 
项 中 描述 的 起 始 艇 号 所 对 应 的 文件 分 配 表 项 ， 如 果 该 文件 只 有 一 个 艇 ， 则 此 处 的 值 为 一 个 结束 标记 ;如果 该 文件 不 止 一 个 禾 ， 则 此 处 的 值 是 它 的 下 一 个 簇 的 簇 


[mm | 
号。 


3.DOs 引 导 扇 区 (DBR) 


在 FAT 中 ， 有 天文 件 系统 目 身 的 一 些 数据 记录 在 POs 引 导 扇 区 (DBR) 中 。 引 导 扇 区 位 于 整个 文件 系统 的 0 号 扇 区 ， 属 于 文件 系统 “保留 房 区 ”的 一 部 
分 。DBR 中 记录 着 文件 系统 的 起 始 位 置 、 大 小 、 文 件 分 配 表 个 数 及 大 小 等 相关 信息 。FAT12 和 FAT16 的 保留 肩 区 通常 为 1 个 扇 区 ， 因 而 也 就 是 DBR 本 身 ; 
FAT32 的 保留 扇 区 则 要 多 一 些 ,， 通 常 有 32 个 扇 区 (DOS 系统 实现 为 32 个 扇 区 ) ， 除 0 号 引导 扇 区 外 ， 还 在 另 一 个 保留 肩 区 中 为 其 仔 储 了 一 个 DBR 备 份 扇 区 。 


4.FAT 的 地 址 管理 
在 FAT 文 件 系统 中 ， 同 时 使 用 扇 区 地 址 和 篮 地 址 两 种 地 址 管理 方式 。 这 是 因为 只 有 存储 用 户 数据 的 数据 区 使 用 复 进 行 管理 (FAT12 和 FAT16 的 根 目录 除 
外 ) ， 所 有 艇 都 位 于 数据 区 。 文 件 系 统 其 他 区 域 是 以 房 区 进行 管理 的 。 


2.1.3 ”FAT32 的 原理 


任何 文件 系统 都 是 用 来 组 织 和 管理 存储 介质 中 的 数据 的 。 一 般 在 使 用 硬盘 存储 数据 之 前 ， 首 先 对 其 进行 分 区 ， 然 后 对 分 区 进行 格式 化 ， 格 了 式 化 之 后 用 户 才 
可 以 创建 文件 来 存储 数据 。 格 式 化 的 过 程 融 是 在 分 区 内 建立 文件 系统 的 过 程 ， 一 个 文件 系统 由 系统 结构 和 按 一 定 规则 存放 的 用 户 数据 组 成 。 


1. 磁 盘 的 分 区 


第 1 章 我 们 已 经 讲 到 ， 硬 盘 由 很 多 盘 片 (platter) 组 成 ， 每 个 盘 片 的 每 个 面 都 有 一 个 读 写 磁 头 (Heads) 。 如 果 有 N 个 盘 片 ， 就 有 2N 个 面 ， 对 应 2N 个 磁 
头 ， 从 0、1、2 开 始 编号 。 每 个 盘 片 被 划分 成 若干 个 同心 圆 磁道 ， 这 样 每 个 盘 片 的 半径 均 为 固定 值 R 的 同心 圆 在 逻辑 上 形成 了 一 个 以 电机 主轴 为 轴 的 柱 面 
(Cylinders) ， 从 外 至 里 编号 为 0、1、2.… 每 个 盘 片 上 的 每 个 磁道 又 被 划分 为 几 十 个 扇 区 (Sector) ， 通 常 的 容量 是 ?512B， 并 按照 一 定 规则 编号 为 1、2、 
3.…. 形 成 Cylindersx HeadsxSector 个 扇 区 。 这 三 个 参数 即 是 硬盘 的 物理 参数 。 


所 谓 磁 盘 分 区 ， 融 是 使 用 分 区 编辑 器 (partition editor) 将 磁盘 的 整个 存储 空间 划分 为 几 个 部 分 ， 每 个 部 分 称 为 一 个 分 区 ， 不 同 的 分 区 可 以 以 不 同 的 文件 
系统 来 组 织 数据 。 在 分 区 时 ， 各 分 区 都 不 允许 跨 柱 面 ， 即 均 以 柱 面 为 单位 ， 这 融 是 通 音 所 说 的 分 区 粒度 。 硬 盘 的 分 区 由 主 分 区 和 扩展 分 区 组 成 ， 扩 展 分 区 又 划 


分 为 多 个 逻辑 分 区 。 


主 分 区 : 也 叫 引 导 分 区 ， 最 多 能 创建 4 个 ， 当 创建 4 个 主 分 区 (注意 扩展 分 区 也 是 一 个 主 分 区 ) 时 ， 就 无 法 再 创建 扩展 分 区 了 ， 当 然 也 就 没有 逻辑 分 区 了 。 
主 分 区 是 可 以 直接 使 用 的 分 区 ， 系 统 局 动 文 件 只 能 放 到 主 分 区 。 


扩展 分 区 : 除了 主 分 区 外 ， 剩 余 的 磁盘 空间 就 是 扩展 分 多 了 ， 扩 展 分 区 是 一 个 概念 ， 实 际 上 是 看 不 到 的 。 扩 展 分 区 是 不 能 直接 使 用 的 ， 使 用 前 需要 将 它 划 
分 为 若干 个 逻辑 分 区 。 


逻辑 分 区 : 在 扩展 分 区 上 面 可 以 创建 多 个 逻辑 分 区 。 即 逻辑 分 区 是 扩展 分 区 的 一 部 分 。 
具有 4 个 分 区 的 磁盘 结构 如 图 2-2 所 示 ， 其 中 主 引 导 扇 区 的 主要 组 成 和 作用 如 下 。 


主 引导 扇 区 位 于 磁盘 的 第 一 个 扇 区 ， 即 0 号 扇 区 ， 主 要 由 主 引 导 记录 (MBR，446 字 节 ) 、 分 区 表 (64 字 节 ) 、 结 束 标志 (2 字 节 ) 三 部 分 构成 ， 总 共 占 


512 字 节 。 


计算 机 在 上 电 完 成 BIOS 自 检 后 ， 会 将 该 主 引 导 扇 区 加 载 到 内 存 中 并 执行 前 面 446 字 节 的 MBR， 引 导 程序 的 主要 作用 如 下 : 扫描 分 区 表 ， 找 到 一 个 激活 (可 
引导 ) 分 区 ; 找到 激活 分 区 的 起 始 扇 区 ; 将 激活 分 区 的 引导 局 区 妆 载 到 内 存 中 ; 将 控制 权 交 给 引导 扇 区 代码 。 在 一 些 非 局 动 磁 盘 上 ，MBR 引 导 代码 可 能 都 是 
0， 这 对 磁盘 使 用 没有 任何 影响 。 
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图 2-2 ”具有 4 个 分 区 的 磁盘 结构 


t 


分 区 表 是 磁盘 管理 中 最 重要 的 部 分 ， 通 过 分 区 表 信 息 可 定位 各 个 分 区 ,访问 用 户 数 据 。 每 个 分 区 表 项 占用 16 字 节 。 这 16 字 节 中 存 有 活动 状态 标志 、 文 件 系 
统 标识 、 起 止 柱 面 号 、 磁 头号 、 扇 区 号 、 隐 合 扇 区 数目 (4 字 节 ) 、 分 区 总 扇 区 数目 〈4 字 节 ) 等 内 容 。 由 于 主 引 导 扇 区 只 有 64 字 节 用 于 分 区 表 ， 所 以 只 能 记录 
4 个 分 区 的 信息 。 这 融 是 硬盘 主 分 区 数目 不 能 超过 4 个 的 原因 。 需 要 注意 的 是 ， 分 区 表 项 的 第 1 字 节 表示 该 分 区 是 否 是 活动 分 区 ， 即 是 否 包含 系统 引导 扇 区 ， 用 


将 汪 


来 引导 操作 系统 。 每 个 磁盘 只 能 同时 有 一 个 活动 分 区 ， 活 动 分 区 的 引导 指示 符 是 0x80， 其 他 均 为 0x00; 尽管 我 们 可 以 通过 一 些 工具 来 手动 修改 引导 指示 符 ， 
但 是 引导 程序 只 会 查找 并 使 用 第 一 个 引导 指示 符 为 0x80 的 活动 分 


“55AA” 为 结束 标志 ， 或 者 称 魔 数 ， 占 主 引 导 扇 区 最 后 2 字 节 。 每 次 执行 系统 引导 代码 时 都 会 检查 主 引 导 扇 区 最 后 2 字 节 是 人 否 是 “55AA”， 若 是 ， 则 继续 
执行 后 续 的 程序 ， 否 则 认为 这 是 一 个 无 效 的 引导 扇 区， 停止 引导 系统 。 


2.FAT32 文 件 系统 结构 


FAT 文 件 系统 分 为 FAT12、FAT16、FAT32 三 种 类 型 。 这 三 种 文件 系统 的 主要 区 别 在 于 FAT 项 占据 的 位 数 不 同 。 目 前 使 用 最 多 的 是 FAT32， 所 以 本 书 将 以 
FAT32 为 例 详细 讲解 FAT 文 件 系统 。 


文件 系统 安装 在 磁盘 分 区 上 ， 一 个 FAT32 文 件 系统 结构 如 图 2-3 所 示 。 


引导 其 余 保留 FAT2 其 他 目录 及 


1 个 而 区 31 个 扇 区 根据 实际 情况 取 大 小 同 FATI1 不 足 一 簇 
Yabo ni pe 


图 2-3 FAT32 文 件 系 统 结 构 
(1) 保留 扇 区 


保留 扇 区 由 引导 扇 区 和 其 余 保 留 扇 区 两 部 分 组 成 。 引 导 扇 区 也 称 为 DBR (DOS Boot Record) 扇 区 ， 通 常 占用 磁盘 分 区 在 逻辑 上 的 第 0 扇 区 ， 是 保留 扇 区 
中 的 第 1 个 扇 区 ， 也 是 文件 系统 的 第 1 个 扇 区 。 这 512 字 节 中 包含 了 跳 转 指令 、 广 商标 志 、 操 作 系 统 版 本 号 、BIOs 参 数 块 (BPB) 、 扩 展 BPB、 操 作 系统 引导 程 
序 、 结 束 标志 等 部 分 。 其 中 BPB 记 录 着 文件 系统 的 参数 ， 包 括 : 每 扇 区 字 节 数 、 每 艇 扇 区 数 、 保 留 扇 区 数 、FAT 表 项 个 数 、 文 件 系统 大 小 〈 书 区 数 ) 、 每 个 
FAT 表 项 大 小 〈 扇 区 数 ) 、 根 目录 起 始 艇 号 等 。 


DBR 肩 区 的 结构 定义 如 表 2-1 所 示 。 


表 2-1 DBR 扇 区 结构 表 


字 节 位 移 “| ”字段 长 度 作 用 

0x00 3 过 地 负责 跳 过 接 下 来 的 不 可 执行 的 字 节 (BPB 和 扩展 
I BPB)， 跳 到 OS 引导 程序 代码 部 分 

es ST 格式 化 该 分 区 的 操作 系统 的 名 称 和 版 本 号 





BIOS 参数 块 ， 为 可 执行 OS 引导 代码 提供 相关 参数 


UE 420 学 市 OS 引导 程序 代码 
0x01FE 2 有 效 结 束 标志 OxAASS 





操作 系统 在 司 动 过 程 中 ，MBR 将 CPU 执行 转移 给 DBR，DBR 的 前 三 字 节 是 可 执行 的 CPU 跳 转 指令 。 该 指令 负责 跳 过 接 下 来 的 几 个 不 可 执行 的 字 节 (BPB 和 
扩展 BPB) ， 跳 到 操作 系统 引导 代码 部 分 ， 继 续 局 动 操作 系统 。 


在 FAT32 中 ， 保 留 肩 区 的 个 数 通 常 为 32。FAT32 中 的 保留 房 区 除了 该 分 区 第 0 扇 区 用 作 DBR、 第 2 房 区 (Windows98 系 统 ) 或 第 0XxC 扇 区 
(Windows2000、Windows XP) 用 作 OS 引 导 代码 扩展 部 分 外 ， 其 余 房 区 都 不 参与 操作 系统 管理 与 磁盘 数据 管理 ， 通 常情 况 下 是 没 用 的 ， 只 是 为 了 对 DBR 作 
备份 或 留待 以 后 升级 时 用 。 在 FAT16 及 FAT12 文 件 系 统 中 ， 保 留 扇 区 的 数据 通常 设置 为 1， 即 仅 售 DBR 记 区。 


(2) 文件 分 配 表 (FAT) 


文件 分 配 表 紧 随 保留 扇 区 之 后 ， 共 有 两 个 : FAT1 和 FAT2， 其 中 FAT2 是 FAT1 的 备份 ， 即 这 两 个 文件 分 配 表 通常 是 一 致 的 ，FAT 文 件 系 统 的 名 称 也 是 因此 
而 来 。 对 于 文件 系统 来 说 ，FAT 有 两 个 重要 作用 : 描述 篮 的 分 配 状态 以 及 标明 文件 或 目录 的 下 一 禾 的 禾 号 。 


FAT32 中 复 地 址 长 度 为 32 位 ，FAT 中 的 所 有 字 节 位 置 以 32 位 〈4 字 节 ) 为 单位 进行 划分 ， 并 对 所 有 划分 后 的 位 置 由 0 进行 地 址 编号 。0 号 地 址 与 1 号 地 址 被 系 
统 保留 并 存储 特殊 标志 内 容 。 从 2 号 地 址 开始 ， 每 个 地 址 对 应 于 数据 区 的 艇 号 ，FAT 中 的 地 址 编号 与 数据 区 中 的 艇 号 相同 。 我 们 称 FAT 中 的 这 些 地 址 为 FAT 表 


项 ，FAT 表 项 中 记录 的 值 称 为 FAT 表 项 值 。FAT 表 项 值 的 取 值 情况 如 下 : 


1) 当 文 件 系统 被 创建 ， 也 就 是 进行 格式 化 操作 时 ， 分 配给 FAT 区 域 的 空间 将 会 被 清空 ， 在 FAT1 与 FAT2 的 0 号 表 项 与 1 号 表 项 写 入 特定 值 。 由 于 创建 文件 系 
统 的 同时 也 会 创建 根 目 录 ， 也 束 为 根 目录 分 配 了 一 个 簇 空间， 通常 为 2 号 艇 ,所 以 2 号 艇 对 应 的 2 号 FAT 表 项 也 会 被 写 入 一 个 结束 标记 。 


2) 如 果 某 个 簇 未 被 分 配 使 用 ， 它 所 对 应 的 FAT 表 项 内 的 FAT 表 项 值 即 用 0 进行 填充 ， 表 示 该 FAT 表 项 所 对 应 的 簇 未 被 分 配 。 


3) 当 某 个 艇 已 被 分 配 使 用 时 ， 则 它 对 应 的 FAT 表 项 内 的 FAT 表 项 值 也 就 是 该 文件 的 下 一 个 存储 位 置 的 艇 号 。 如 果 该 文件 结束 于 该 艇 ， 则 在 它 的 FAT 表 项 中 
记录 的 是 一 个 文件 结束 标记 ， 对 于 FAT32 而 言 ， 代 表 文 件 结束 的 FAT 表 项 值 为 0xOFFFFFFF。 


4) 如 果 某 个 艇 存在 坏 扇 区 ， 则 整个 斤 会 用 FAT 表 项 值 0xFFFFFF7 标 记 为 坏 徐 ， 并 不 再 使 用 ， 这 个 坏 禾 标记 就 记录 在 它 所 对 应 的 FAT 表 项 中 。 
5) 由 于 艇 号 起 始 于 2 号 ， 所 以 FAT 表 项 的 0 号 表 项 与 1 号 表 项 不 与 任何 篮 对 应 。FAT32 的 0 号 表 项 值 总 是 “F8FFFFOF”。 


6) 1 号 表 项 可 能 被 用 于 记录 “ 脏 ” 标 志 ， 以 说 明文 件 系统 没有 被 正 芝 卸载 或 者 磁盘 表面 存在 错误 。 不 过 这 个 值 并 不 重要 。 正 党 情况 下 1 号 表 项 的 值 
为 “FFFFFFFF” 或 “FFFFFFOF”。 


7) 在 文件 系统 中 新 建文 件 时 ， 如 果 新 建 的 文件 只 占用 一 个 艇 ,为 其 分 配 的 艇 对 应 的 FAT 表 项 将 会 写 入 结束 标记 。 如 果 新 建 的 文件 不 只 占用 一 个 艇 ， 则 在 
其 所 占用 的 每 个 簇 对 应 的 FAT 表 项 中 写 入 为 其 分 配 的 下 一 艇 的 艇 号 ， 在 最 后 一 个 艇 对 应 的 FAT 表 项 中 写 入 结束 标记 。 


8) 新 建 目 录 时 ， 只 为 其 分 配 一 个 复 的 空间 ， 对 应 的 FAT 表 项 中 写 入 结束 标记 。 当 目录 增 大 超出 一 个 篮 的 大 小 时 ， 将 会 在 空 采 空间 中 继续 为 其 分 配 一 个 
， 并 在 FAT 中 为 其 建 YFAT 表 链 以 描述 它 所 占用 的 艇 情况 。 


油 


9) 对 文件 或 目录 进行 操作 上 时， 它们 所 对 应 的 FAT 表 项 将 会 被 清空 ,设置 为 0 以 表示 其 所 对 应 的 簇 处 于 未 分 配 状态 。 
(3) 数据 区 


数据 区 是 真正 用 于 人 存放 用 户 数据 的 区 域 ， 文 件 的 内 容 都 存放 在 数 据 区 。 数 据 区 紧 跟 在 FAT2 之 后 ， 复 是 最 小 分 配 单位 ， 所 有 的 篮 从 2 开始 进行 编号 。 也 残 是 
说 ，2 号 禾 的 起 始 位 置 就 是 数据 区 的 起 始 位 置 。FAT 文 件 系统 的 数据 存储 采用 小 端 (Little Endian) 方式 。 


` 根 目 录 


虽然 原则 上 FAT32 人 允许 根 目 录 位 于 数据 区 的 任何 位 置 ， 但 通常 情况 下 它 都 位 于 2 号 艇 。 和 要 想 定 位 一 个 FAT32 文 件 系统 的 数据 起 始 处 ， 可 以 通过 引导 扇 区 的 
相关 参数 计算 出 来 。 首 先 从 引导 扇 区 的 偏 移 9Gx0E~0x0F 字 节 处 得 到 保留 扇 区 数 ; 然后 从 偏 移 0x10 字 节 处 得 到 FAT 的 个 数 ; 最 后 从 偏 移 Gx24~0x27 字 节 处 得 到 每 
个 FAT 的 大 小 扇 区 数 。 利 用 如 下 公 陈 计算 : 


数据 区 起 始 扇 区 号 = 保留 扇 区 数 + 每 个 FAT 的 大 小 扇 区 数 xFAT 个 数 
要 想 计 算 其 他 已 知 篮 号 的 扇 区 号 ， 还 要 由 引导 扇 区 的 偏 移 0x0D 字 节 处 查找 到 每 个 篮 大 小 扇 区 数 ， 并 使 用 如 下 公式 计算 : 
叶 复 起 始 扇 区 号 = 保留 肩 区 数 + 每 个 FAT 的 大 小 扇 区 数 xFAT 个 数 + (该 艇 艇 号 -2) x 每 禾 忆 区 数 


根 目 录 在 文件 系统 建立 时 即 已 被 创建 ， 其 目的 就 是 存储 目录 (也 称 文件 夹 ) 或 文件 的 目录 项 。 文 件 系统 刚 被 创建 时 还 没有 存储 任何 数据 ， 根 目录 下 没有 任 
何 内 容 ， 文 件 系统 只 是 为 根 目录 分 配 了 一 个 艇 的 空间 (通常 为 2 号 艇 ) ， 将 结束 标记 写 入 该 艇 对 应 的 FAT 表 项 ， 表 示 该 艇 已 经 被 分 配 使 用 。 这 时 候 为 根 目录 分 
配 的 空间 没有 任何 内 容 。 


不 管 是 根 目录 还 是 子 目录 下 的 目录 项 ， 都 具有 以 下 四 个 基本 特性 : 第 一 ， 为 文件 或 目录 分 配 的 第 一 个 复 的 复 号 记录 在 它 的 目录 项 中 ， 其 他 后 续 篮 则 由 FAT 
中 的 FAT 表 链 进行 跟踪 。 第 二 ， 目 录 项 中 除 记录 子 目录 或 文件 起 始 艇 号 外 ， 还 记录 它 的 名 称 、 大 小 〈 子 目录 没有 大 小 ) 、 时 间 值 等 信息 。 第 三 ， 每 个 子 目录 或 
文件 除 具 有 一 个 短文 件 名 目录 项 外 ， 还 会 有 长 文件 名 目录 项 。 短 文件 名 目录 项 固定 占用 32 字 节 ， 长 文件 名 目录 项 则 根据 需要 占用 1 个 或 者 若干 个 32 字 节 。 第 
四 ， 对 于 同一 个 子 目录 或 文件 ， 它 的 长 文件 名 目录 项 存放 在 它 的 短文 件 名 目录 项 之 前 ， 如 果 长 文件 名 目录 项 占用 多 个 32 字 节 ， 则 按 倒序 存放 于 短文 件 名 目录 项 
之 前 。 


0 


在 FAT32 文 件 系 统 中 ， 除 根 目 录 在 创建 文件 系统 时 即 被 建立 并 分 配 空间 外 ， 其 他 所 有 的 子 目录 都 是 在 使 用 过 程 中 根据 需要 建立 的 。 新 建 一 个 子 目录 时 ,在 
其 父 目 录 中 为 其 建立 目录 项 ， 在 空 闪 空间 中 为 其 分 配 一 个 艇 并 对 该 禾 进 行 清 零 操 作 ， 同 时 在 为 其 分 配 的 艇 空间 开始 处 建立 两 个 目录 项 来 摘 述 子 目 录 本 身 及 其 父 
目录 的 信息 ， 以 使 目录 间 建 立 联系 。 


. 目录 项 


在 FAT32 文 件 系 统 中 ， 根 据 结构 不 同 可 以 将 目录 项 大 致 分 为 五 种 : 卷 标 目录 项 、“.” 目 录 项 和 “http://www.hzcourse.comy/resource/readBook? 


path=/openresources/teach ebook/uncompressed/16547/OEBPS/Text/..” 目 录 项 、 短 文件 名 目录 项 和 长 文件 名 目录 项 。 要 找到 一 个 目录 项 的 位 置 只 能 
用 分 配给 文件 或 子 目 录 的 全 名 进行 搜索 。 


豆 文 件 名 目录 项 : 这 是 最 重要 的 数据 结构 ， 其 中 存放 着 有 关子 目录 或 文件 的 短文 件 名 、 属 性 、 起 始 艇 号 、 时 间 值 以 及 内 容 大 小 等 信息 。 在 FAT32 文 件 系 统 
中 ， 子 目录 被 看 作 一 种 特殊 的 文件 。 之 所 以 称 其 为 短文 件 名 目录 项 ， 是 因为 它 所 记录 的 文件 名 延续 了 DOS 时 代 的 8.3 格 式 ， 即 8 个 字符 的 名 字 加 上 3 个 字符 的 扩 
展 名 ， 如 果 文 件 名 不 足 8 个 字符 ， 用 0x20 进 行 填 元 ; 超过 8 个 字符 时 则 会 被 截 短 ， 因 为 短文 件 名 目录 项 中 没有 足够 的 空间 记录 超出 的 部 分 ， 截 短 的 方法 是 取 文 
件 名 的 前 6 个 字符 加 上 “~1” (如 果 有 同名 文件 ， 则 会 依次 递增 该 数值 ) ， 然 后 加 上 其 扩展 名 ; 如 果 是 子 目录 ， 则 将 扩展 名 部 分 用 “0x20” 进 行 填充 。 


为 了 解决 长 文件 名 的 问题 ，FAT 文 件 系统 又 增加 了 一 种 “长 文件 名 ”目录 项 结构 。 其 从 Windows95 开 始 ， 不 管 文件 名 的 长 度 是 否 超过 8 个 字符 ， 都 会 同时 
为 其 创建 短文 件 名 目录 项 和 长 文件 名 目录 项 ， 因 为 短文 件 名 不 区 分 大 小 写 ， 而 长 文件 名 则 是 区 分 大 小 写 的 。 


长 文件 名 目录 项 : FAT32 文 件 系统 在 为 文件 分 配 短 文件 名 目录 项 的 同时 会 为 其 分 配 长 文件 名 目录 项 。 文 件 系统 在 为 文件 创建 长 文件 名 (Long File 
Name，LFN) 类 型 的 目录 项 时 ， 并 没有 舍 奔 原 有 的 短文 件 名 目录 项 ， 具 有 LFN 的 文件 同时 也 有 一 个 常规 的 SFN (Short File Name， 短 文件 名 ) 类 型 目录 项 。 
之 所 以 仍然 需要 3FN， 是 因为 LFN 目 录 项 只 包含 文件 的 名 字 ， 而 不 包括 任何 有 天 时 间 、 大 小 及 起 始 艇 号 等 信息 ， 这 些 信息 仍然 需要 用 SFN 目 录 项 来 记录 。 


“.” 目 录 项 和 和 “http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16547/OEBPS/Text/..” 目 录 
项 : 一 个 子 目录 的 起 始 复 的 前 两 个 目录 项 为 “.” 目 录 项 和 “http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/16547/OEBPS/Text/..” 目 录 项 ， 子 目录 通过 这 两 个 目录 项 及 其 在 父 目录 中 的 目录 项 建立 起 父子 目录 
的 联系 。“.” 目 录 项 位 于 子 目 录 起 始 篮 的 第 一 个 目录 项 位 置 ， 它 用 以 表明 该 篮 是 一 个 子 目 录 的 起 始 艇 。 另 外 ， 该 目录 项 实际 上 是 对 目录 上 自身 的 摘 述 ， 它 记录 了 
该 子 目录 的 时 间 信 息 、 起 始 艇 号 等 。 需 要 注意 的 是 ， 它 所 记录 的 起 始 禾 号 也 融 是 该 子 目录 目前 所 处 的 位 置 。 
“http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16547/OEBPS/Text/..” 目 录 项 位 于 子 目 录 起 始 
艇 的 第 二 个 目录 项 位 置 ， 用 于 摘 述 该 子 目 录 的 父 目 录 的 相关 信息 。 


卷 标 目录 项 : 如 果 创 建文 件 系 统 时 指定 了 卷 标 ， 则 会 在 根 目录 下 第 一 个 目录 项 的 位 置 建立 一 个 卷 标 目录 项 。 卷 标 名 最 多 人 允许 占用 11 字 节 ， 也 残 是 为 短文 件 
名 分 配 的 11 字 节 的 文件 名 区 域 ， 如 果 卷 标 名 不 足 11 字 节 ， 则 用 0x20 填 充 〈 由 于 每 个 汉字 占用 2 字 节 空间 ， 而 卷 标 最 多 允许 11 字 节 ， 所 以 用 汉字 命名 卷 标 时 ， 卷 
标的 长 度 不 能 超过 5 个 汉字 ) 。 卷 标 目录 项 结构 与 普通 短文 件 名 目录 项 结构 完全 相同 ， 但 没有 创建 时 间 和 访问 时 间 ， 只 有 一 个 最 后 修改 时 间 。 


(4) 剩余 扇 区 


分 区 是 以 柱 面 为 粒度 的 ， 如 果 磁 盘 总 空间 不 是 柱 面 的 整数 倍 ， 不 够 一 个 柱 面 的 空间 束 形 成 了 剩余 空间 ， 这 一 部 分 空间 是 无 法 被 利用 的 。 


2.1.4 ” FAT 的 优 缺 点 


1.FAT 文 件 系统 的 优点 


FAT 文 件 系 统 经 过 多 年 的 发 展 和 演进 ， 应 该 说 是 一 个 相当 成 熟 的 文件 系统 ， 其 规范 标准 、 可 靠 稳定 ， 可 以 支持 各 种 不 同 大 小 的 存储 媒介 。 相 比 于 
EXT，FAT 是 一 种 简单 的 文件 系统 ， 被 所 有 版 本 的 Windows 操 作 系 统 和 多 种 类 型 的 嵌入 式 设备 所 支持 。 


2.FAT 文 件 系 统 的 缺点 


FAT32 是 FAT 文 件 系统 目前 的 最 高 版 本 了 ， 改 进 了 诸多 方面 的 缺点 。 但 由 于 先天 不 足 ，FAT 文 件 系统 的 一 些 固 有 缺陷 是 很 难 避 免 的 。FAT 文 件 系统 最 大 的 
缺点 是 ， 如 果 根 目录 和 FAT 所 在 扇 区 出 了 问题 ， 会 导致 整个 文件 系统 的 毁灭 ;另外 FAT 是 链 状 的 ， 在 读 写 文 件 时 ， 如 果 频 繁 移动 文件 指针 ( 读 写 起 点 位 置 ) ， 
可 能 导致 效率 大 幅度 下 降 。 另 外 ， 低 版 本 的 FAT 文 件 系统 只 支持 短文 件 名 8.3 格 式 (8 字 节 基本 部 分 和 3 字 节 扩展 名 ) ， 高 版 本 的 FAT 虽 然 支持 了 长 文件 名 ,但 为 
了 与 低 版 本 兼容 ， 采 用 了 比较 麻烦 的 处 理 方式 ， 这 导致 一 些 潜在 的 隐患 。 例 如 ， 如 果 文 件 系统 的 数据 完整 性 受到 损坏 ， 则 包含 长 文件 名 的 FAT 文 件 系统 的 数据 
恢复 将 比较 困难 。 


2.2 EXT 


EXT 文 件 系统 全 称 是 扩展 文件 系统 (Extended File System) ， 是 Linux 默 认 文 持 的 文件 系统 。 最 早 的 EXT 文 件 系统 出 现在 1992 年 ， 其 后 经 过 不 断 发 展 ， 
先后 出 现 了 四 个 版 本 : EXT1、EXT2、EXT3 和 EXT4。 


2.2.1 EXT 的 友 展 概况 


1992 年 ， 第 1 个 扩展 文件 系统 (EXT1) 在 Linux0.96c 内 核 中 实现 ， 它 第 一 次 使 用 了 虚拟 文件 系统 (VFS) 交换 拷 术 ， 可 以 支持 的 最 大 文件 系统 为 2GB。 


1993 年 1 月 第 2 个 版 本 的 扩展 文件 系统 (EXT2) 被 引入 Linux。 相 比 于 EXT1， 它 从 UNIX 文 件 系统 中 吸取 了 很 多 优点 ， 从 而 成 为 Linux 上 第 一 个 商业 级 文件 
系统 。EXT2 在 磁盘 上 存储 的 (与 磁盘 功能 相关 的 ) 数据 结构 中 预 留 了 很 多 空间 供 未 来 进一步 开 友 使 用 ， 这 也 使 得 它 具 有 很 好 的 可 扩展 性 。EXT2 能 够 文 持 的 最 
大 文件 系统 达到 2TB。 

2001 年 11 月 第 3 个 版 本 的 扩展 文件 系统 (EXT3) 被 引入 Linux， 它 继承 了 EXT2 的 全 部 优点 ， 还 在 可 用 性 、 数 据 完整 性 、 速 度 和 易于 迁移 四 个 方面 有 较 大 改 
进 。EXT3 还 采用 了 日 志 技术 ， 在 系统 突然 友 生 故障 的 情况 下 ， 可 以 大 大 提高 文件 系统 的 可 靠 性 。 在 EXT3 文 件 系 统 中 ， 如 果 使 用 4KB 大 小 的 数据 块 和 32 位 的 块 
号 ， 所 支持 的 最 大 文件 系统 能 达到 16TB。 


第 4 个 版 本 的 扩展 文件 系统 (EXT4) 在 性 能 、 伸 缩 性 和 可 靠 性 等 方面 进行 了 大 量 的 改进 ， 并 引入 了 诸多 新 的 技术， 如 引入 区 段 (Extent) 管理 块 ， 以 及 与 
块 管理 相关 的 延迟 分 配 技 术 等 。EXT4 首 先 在 Linux2.6.19 内 核 中 实现 并 得 到 应 用 ， 在 2.6.28 内 核 中 稳定 下 来 (2008 年 12 月 ) 。EXT4 采 用 了 48 位 块 号 和 区 段 映射 
技术 ， 这 不 仅 增 大 了 文件 系统 的 容量 ， 还 改进 了 对 大 文件 的 访问 效率 ， 在 使 用 4KB 大 小 的 数据 块 时 ，EXT4 可 以 支持 的 最 大 文件 系统 为 1EB。 


2.2.2 ” 树 形 目录 结构 


EXT 文 件 系 统 采用 一 个 独立 的 顶级 树 形 目 录 架 构 〈 即 所 有 一 切 都 从 root 根 目录 开始 ， 延 伸 到 子 目录 ) 来 组 织 和 管理 全 部 文件 。 目 录 文 件 记录 了 本 目录 下 所 
有 文件 和 子 目录 的 信息 (文件 名 和 索引 节点 号 inode) ， 并 依次 存放 在 数据 块 中 ， 采 用 把 文件 名 ( 放 在 目录 文件 中 ) 与 文件 的 其 他 所 有 属性 ( 放 在 索引 节操 
inode 表 中 ) 分 开 和 存储 的 管理 方法 来 大 大 提高 文件 检索 的 速度 ， 如 图 2-4 所 示 。 
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图 2-4 ”EXT 文件 系统 的 树 形 结 构 


2.2.3 ”EXT 的 磁盘 布局 


EXT2 是 Linux 上 标准 的 文件 系统 ，EXT3 是 在 EXT2 基 础 上 增加 日 志 形 成 的 ， 其 思想 可 以 退 溯 到 早期 UNIX 家 族 友 展 的 基于 超级 块 和 inode 的 经 典 概念 ，EXT4 
是 EXT3 的 进一步 升级 。 因 此 ， 本 节 以 EXT2 为 模板 介绍 EXT 文 件 系统 的 磁盘 布局 。 图 2-5 为 EXT2 文 件 系统 的 磁盘 布局 。 


在 EXT 文 件 系 统 中 ， 存 储 的 最 小 单位 是 块 (block) ， 一 个 块 究竟 多 大 是 在 格式 化 时 确定 的 ， 如 可 以 设 定 块 大 小 为 1024、2048 或 4096 字 节 ， 一 旦 文件 系统 
创建 好 以 后 ， 块 的 大 小 残 不 能 改变 了 。 这 些 块 被 聚 在 一 起 分 成 几 个 大 的 块 组 (block group) 。 每 个 块 组 中 有 多 少 个 块 是 固定 的 (最 后 一 个 块 组 除外 ， 其 所 管 
理 的 块 可 能 会 少 一 些 ) 。 而 局 动 块 (boot block) 的 大 小 是 确定 的 ， 即 1KB， 局 动 块 由 PC 标准 规定 ， 用 来 存储 磁盘 分 区 信息 和 局 动 信息 ， 任 何 文件 系统 都 不 能 
使 用 局 动 块 。 局 动 块 之 后 才 是 EXT 文 件 系统 的 开始 ，EXT 文 件 系统 将 整个 分 区 划 成 各 干 个 同样 大 小 的 块 组 ， 每 个 块 组 都 由 以 下 部 分 组 成 : 超级 块 (super 
block) 、 块 组 描述 符 表 (GDT) 、 预 留 块 组 描述 符 表 (reserved GDT) 、 块 位 图 (block bitmap) 、 节 点 位 图 (inode bitmap) 、 节 点 表 (inode table) 
和 数据 块 (data block) 。 
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图 2-5 EXT2 文 件 系 统 的 磁盘 布局 
1. 超 级 块 


超级 块 存储 了 EXT 文 件 系 统 的 全 局 配置 参数 (如 数据 块 大 小 、 忌 块 数 和 索引 节点 忆 数 等 ， 这 些 参数 在 文件 系统 创建 时 就 确定 下 来 了 ) 和 动态 信息 (如 当前 
空 用 块 数 和 空间 索引 节点 数 等 ， 可 以 在 运行 中 改变 ) 。 对 超级 块 的 访问 必须 是 互 斥 的 ， 即 任 一 时 刻 最 多 只 能 有 一 个 进程 访问 超级 块 。 


原始 做 法 是 在 每 一 个 块 组 中 都 保留 一 个 超级 块 的 备份 ， 在 系统 局 动 时 内 核 读 入 块 组 0 中 的 超级 块 到 内 存 中 ， 其 他 块 组 的 备份 只 用 于 当 块 组 0 的 超级 块 损坏 
时 。 当 采用 sparse superblock 技 术 时 ， 超 级 块 、 块 组 摘 述 符 表 和 预 留 块 组 摘 述 符 表 只 写 入 到 块 组 9、1， 以 及 其 他 块 组 号 可 以 表示 为 3、5、7 的 突 的 块 组 中 。 
这 是 现在 的 默认 技术 ， 除 非 在 创建 文件 系统 时 指定 屏 菩 它 。 


由 于 每 个 分 区 的 块 组 0 的 特殊 性 ， 最 开始 的 1024 字 节 ( 即 0~1 号 扇 区 ) 并 未 使 用 ， 而 是 留 给 了 引导 区 。 所 以 ， 从 分 区 的 第 1024 字 节 开 始 为 超级 块 开始 的 位 
置 。 而 块 组 1 及 其 后 面 的 块 组 没有 引导 区 ， 也 就 没有 上 述 1024 字 节 的 填充 ， 块 组 从 超级 块 开始 。 对 超级 块 的 数据 结构 定义 在 内 核 文 
件 /include/Linux/EXT4 fs.h 中 ， 超 级 块 中 包含 的 内 容 及 每 个 字段 的 意义 如 图 2-6 所 示 。 





分 区 的 节 丘 思 数 

分 区 的 块 总 数 

分 区 的 保留 块 数 

分 区 的 空闲 块 数 

分 区 的 空闲 节点 数 

0 写 块 组 的 起 始 块 号 
每 个 块 占用 的 字 节 数 
每 个 块 组 中 的 块 数 

每 个 块 组 中 的 节点 数 
文件 系统 最 后 挂 载 时 间 
文件 系统 最 后 写 入 时 间 
魔术 标签 

上 一 次 check 时 间 
第 一 个 非 保 留 节点 号 


s inodes count 

s blocks count lo 

s r blocks count lo 
s free blocks count lo 
s free_ inodes count 
s first data block 

s log block size 
s_blocks_per_group 
s_inodes_per_group 
s_mtime 

s Wtime 

s_magic 

s lastcheck 


s first_ino 


回 定 的 
低 32 位 
低 32 位 
低 32 位 


0 表示 1KB，1 表 示 2KB，2 表 示 4KB 


值 为 0xEF53， 表 明 是 EXT 文 件 系统 
最 后 一 次 检查 的 时 间 

用 户 数 据 可 用 的 第 1 个 节 扣 
ll 
箭 “1lostfound” 所 用 


本 超级 块 所 在 的 块 组 号 


郊 名 
预 分 配 的 块 数 
为 目录 预 分 配 的 块 数 


为 在 线 增 长 而 需要 的 每 个 


块 组 摘 述 得 保留 的 块 数 
日 志文 件 的 和 局 


块 组 描述 待 大 小 


第 一 个 使 用 元 块 组 的 块 组 


在 GDT 中 的 数据 块 偏 移 
分 区 创建 时 间 

分 区 的 块 总 数 

分 区 的 保留 块 数 

分 区 的 空闲 块 数 
FLEX_BG 块 组 大 小 


s block group nr 


s volume_ name[16] 
s_prealloc_ blocks 


s_prealloc dir_blocks 


s reserved gdt blocks 


s journal inum 


s_desc size 


s first meta bg 


s_mkfs_ time 
s blocks count hi 


sr blocks count_ hi 


超级 块 的 备份 并 非 简单 的 完全 
备份 ， 会 标明 上 自身 所 在 的 块 组 


EE 


即 预 留 块 组 措 述 符 表 的 大 小 


仅 EXT4_ FEATURE COMPAT_HA 
S_JOURNAL 设置 时 有 效 


仅 当 meta_bg 设置 为 有 效 


高 32 位 ， 仅 EXT4_FEATURE 
_COMPAT_64B 
IT 设置 为 有 效 时 


s free blocks count hi 


s log groups per flex 


图 2-6 ”超级 块 的 内 容 


2As log groups per flex 


在 超级 块 中 ， 魔 木 标签 是 一 个 很 重要 的 字段 ， 在 EXT2/EXT3/EXT4 中 ， 这 个 字段 的 值 为 0xEF53， 否 则 这 个 分 区 殊 不 是 一 个 正常 的 EXT2/EXT3/EXT4 文 件 系 
统 。 


另 一 个 重要 的 字段 是 每 个 块 占用 的 字 节 数 ， 其 对 应 的 数据 结构 是 s_log_block_size， 标 识 文件 系统 中 块 的 大 小 (以 字 节 为 单位 ) 为 
(B=1<< (s log_block_size+10) ) 。 例 如 ， 如 果 值 为 0 时 ， 则 块 的 大 小 为 1024B， 也 是 最 小 的 块 大 小 ; 如 果 值 为 2， 那 么 块 的 大 小 为 4096B。 


2. 块 组 摘 述 符 表 


块 组 摘 述 符 表 (GDT，Group Descriptor Table) 由 很 多 块 组 摘 述 符 组 成 ， 整 个 分 区 分 成 多 少 个 块 组 融 对 应 有 多 少 个 块 组 摘 述 符 。 每 个 块 组 摘 述 符 仓 储 一 
个 块 组 的 摘 述 信息 ， 如 在 这 个 块 组 中 从 哪里 开始 是 inode 表 、 从 哪里 开始 是 数据 块 、 空 朵 的 inode 和 数据 块 还 有 多 少 个 等 。 与 超级 块 类 似 ， 块 组 摘 述 符 表 在 每 

个 块 组 的 开头 也 都 有 一 份 拷贝 ， 这 些 信息 是 非常 重要 的 ， 一 旦 超级 块 意外 损坏 融会 丢失 整个 分 区 的 数据 。 通 音 内 核 只 用 到 第 0 个 块 组 中 的 拷贝 ， 当 执行 e2fsck 

检查 文件 系统 一 致 性 时 ， 第 0 个 块 组 中 的 超级 块 和 块 组 摘 述 符 表 融会 拷贝 到 其 他 块 组 ， 这 样 当 第 0 个 块 组 的 开头 意外 损坏 时 融 可 以 用 其 他 拷贝 来 恢复 ， 从 而 减少 
损失 。 


3. 块 位 图 


一 个 块 组 中 的 块 是 这 样 利用 的 ， 数 据 块 存储 所 有 文件 的 数据 ， 比 如 某 个 分 区 的 块 大 小 是 1024 字 节 ， 某 个 文件 是 2049 字 节 ， 那 么 就 需要 三 个 数据 块 来 存 
储 ， 即 使 第 三 个 块 只 存储 一 字 节 也 需要 占用 一 个 整 块 ; 超级 块 、 块 组 摘 述 符 表 、 块 位 图 、inode 位 图 、inode 表 这 几 部 分 存储 该 块 组 的 摘 述 信息 。 那 么 如 何 知 
道 哪些 块 已 经 用 来 存储 文件 数据 或 其 他 描述 信息 ， 哪 些 块 仍然 空 朵 可 用 呢 ?” 块 位 图 融 是 用 来 摘 述 整个 块 组 中 哪些 块 已 用 、 哪 些 块 空 朵 的 ， 它 本 身 占 一 个 块 ， 其 
中 的 每 位 代表 本 块 组 中 的 一 个 块 ， 该 位 为 1 表示 该 块 已 用 ， 为 0 表示 该 块 空 采 可 用 。 


4. 节 点 位 图 
与 块 位 图 类 似 ， 本 身 占 一 个 块 ， 其 中 每 位 表示 一 个 inode 是 否 空 闪 可 用 。 
5. 匠 向 表 


我 们 知道 ， 一 个 文件 除了 数据 需要 存储 之 外 ， 一 些 描 述 信 息 也 需要 存储 ， 如 文件 类 型 (常规 、 目 录 、 符 号 链接 等 ) 、 权 限 、 文 件 大 小 、 创 建 /修改 /访问 时 
间 等 ， 这 些 信息 存在 inode 中 而 不 是 数据 块 中 。 每 个 文件 都 有 一 个 iInode， 一 个 块 组 中 的 所 有 inode 组 成 了 inode 表 (节点 表 ) 。 


inode 表 占 多 少 个 块 在 格式 化 时 束 要 决定 并 写 入 块 组 描述 得 中 ，mke2fs 格 式 化 工具 的 默认 策略 是 一 个 块 组 有 多 少 个 8KB 束 分 配 多 少 个 inode。 由 于 数据 块 
占 了 整个 块 组 的 绝 大 部 分 ， 也 可 以 近似 认为 数据 块 有 多 少 个 8KB 就 分 配 多 少 个 inode， 换 句 话说 ， 如 果 平 均 每 个 文件 的 大 小 是 8KB， 当 分 区 存 满 的 时 候 inode 表 
会 得 到 比较 充分 的 利用 ， 数 据 块 也 不 沪 费 ， 如 果 这 个 分 区 存 的 都 是 很 大 的 文件 (比如 电影 ) ， 则 数据 块 用 完 的 时 候 inode 会 有 一 些 沪 费 ， 如 果 这 个 分 区 存 的 都 
是 很 小 的 文件 (比如 源 代码 ) ， 则 有 可 能 数据 块 还 没 用 完 inode 束 已 经 用 完了 ， 数 据 块 可 能 有 很 大 的 浪费 。 如 果 用 户 在 格式 化 时 能 够 对 这 个 分 区 以 后 要 存储 的 
文件 大 小 进行 预测 ， 也 可 以 用 mke2fs 的 -i 参数 手动 指定 每 多 少 字 节 分 配 一 个 inode。 


6. 数 据 块 
根据 不 同 的 文件 类 型 有 以 下 几 种 情况 : 
1) 对 于 常规 文件 ， 文 件 的 数据 存储 在 数据 块 中 。 


2) 对 于 目录 ,该 目录 下 的 所 有 文件 名 和 目录 名 存储 在 数据 块 中 ， 注 意 文件 名 保存 在 它 所 在 目录 的 数据 块 中 ， 除 文件 名 之 外 ，1s-| 命 令 看 到 的 其 他 信息 都 保 
存在 该 文件 的 inode 中 。 注 意 这 个 概念 : 目录 也 是 一 种 文件 ， 是 一 种 特殊 类 型 的 文件 。 


3) 对 于 符号 链接 ， 如 果 目 标 路 径 名 较 短 则 直接 保存 在 inode 中 以 便 更 快 地 查找 ， 如 果 目 标 路 径 名 较 长 则 分 配 一 个 数据 块 来 保存 。 


4) 设备 文件 、FIFO 和 socket 等 特殊 文件 没有 数据 块 ， 设 备 文件 的 主 设备 号 和 次 设备 号 保存 在 inode 中 。 


2.2.4 数据 块 寻 址 方法 


如 果 一 个 文件 有 多 个 数据 块 ， 这 些 数据 块 很 可 能 不 是 连续 存放 的 ， 应 该 如 何 寻 址 到 每 个 块 呢 ?实际 上 ， 根 目录 的 数据 块 是 通过 其 inode 中 的 索引 项 
Blocks[0] 找 到 的 ， 事 实 上 这 样 的 索引 项 一 共有 15 个 ， 从 Blocks[0] 到 Blocks[14]， 每 个 率 引 项 占 4 字 节 。 前 12 个 索引 项 都 表示 块 编号 ， 如 Blocks[0] 字 段 保存 着 
24， 融 表示 第 24 个 块 是 该 文件 的 数据 块 ， 如 果 块 大 小 是 1KB， 这 样 可 以 表示 从 0~ 12KB 的 文件 。 如 果 剩 下 的 三 个 索引 项 Blocks[12] 到 Blocks[14] 也 是 这 么 用 
的 ， 融 只 能 表示 最 大 15KB 的 文件 了 ， 这 是 远 远 不 够 的 ， 事 实 上 ， 剩 下 的 三 个 系 引 项 都 是 间接 索引 。 如 图 2- 7 所 示 。 


12 个 直接 
块 的 块 号 


一 级 索引 指针 
二 级 索引 指针 
三 级 索引 指针 





图 2-7 EXT3 文 件数 据 块 的 组 织 示意 图 


索引 项 Blocks[12] 所 指向 的 块 并 非 数 据 块 ， 而 是 称 为 间接 寻 址 块 (Indirect Block) ， 其 中 存放 的 都 是 类 似 Blocks[0] 这 种 索引 项 ， 再 由 率 引 项 指向 数据 
块 ， 设 块 大 小 为 bp， 那么 一 个 间接 寻 址 块 中 可 以 存放 b/4 个 索引 项 ， 指 向 b/4 个 数据 块 。 所 以 如 果 把 Blocks[0] 到 Blocks[12] 都 用 上 ， 最 多 可 以 表示 b/4+12 个 数 
据 块 ， 对 于 块 大 小 是 1KB 的 情况 ， 最 大 可 表示 268KB 的 文件 。 二 级 索引 指针 可 以 管理 的 文件 大 小 为 64MB， 三 级 索引 指针 可 以 管理 的 文件 大 小 为 16GB。 


表 2-2 列 出 了 EXT 文 件 系统 设置 不 同 大 小 的 数据 块 时 ， 文 件 和 文件 系统 的 限 长 。 


表 2-2 每 块 的 字 节 数 与 文件 系统 最 大 长 度 的 关系 


每 块 的 字 节 数 文件 系统 的 最 大 长 度 
IKB 2048GB (2TB) 
?KB 8192GB ( 8TB) 
4KB 16384GB ( 16TB) 
8KB 32768GB ( 32TB) 


在 EXT3 中 ， 对 于 大 文件 来 说 ， 存 放 数 据 需 要 经 过 几 级 间接 索引 ， 这 就 导致 了 存 取 大 文件 数据 时 的 性 能 比较 差 。 在 实际 应 用 中 ， 测 试 表明 数据 不 连续 的 情 
况 不 会 超过 10%， 所 以 在 EXT4 中 引入 了 区 段 的 概念 来 表示 文件 数据 所 在 的 位 置 。 区 段 是 用 来 描述 保存 文件 数据 所 使 用 的 连续 物理 块 的 一 段 范围 。 每 个 区 段 由 
EXT4_EXTent 结 构 类 型 来 定义 ， 占 12 字 节 ， 区 段 的 结构 类 型 定义 在 内 核 文 件 /include/Linux/EXT4 fs_ EXTents.h 中 。 


2.2.5 ”日志 系统 


对 文件 的 存储 包括 对 文件 数据 (data) 和 文件 属性 (元 数据 ，metadata) 的 存储。 为 了 在 意外 情况 〈 如 系统 崩溃 ) 下 ， 可 以 通过 恢复 程序 保证 数据 的 一 
致 性 和 完整 性 ，EXT3 文 件 系统 引入 了 日 志 的 概念 ，EXT4 还 能 对 日 志 进 行 校 验 和 和 ， 确 保有 效 的 数据 变更 能 够 在 底层 文件 系统 上 正确 完成 。 EXT3/4 日 志 存 放 在 
journal 文件 中 ， 并 提供 了 三 种 日 志 的 记录 方式 : 


1) data=writeback 方 式 : 在 这 种 方式 下 ，EXT3 文 件 系统 只 对 元 数据 写 日 志 。 虽 然 这 会 让 最 近 修 改 的 文件 在 出 现 意 外 事件 时 损坏 ， 但 可 以 得 到 较 高 的 速 
度 。 


2) data=ordered 方 式 (默认 方式 ) : 在 这 种 方式 下 ，EXT3 文 件 系 统 也 只 将 元 数据 写 入 日 志 系 统 ， 但 还 把 对 数据 的 每 一 次 更 新 都 作为 一 个 事务 写 入 相关 
文件 中 ， 这 样 有 效 地 解决 了 第 一 种 方式 中 文件 数据 被 损坏 的 问题 。 但 是 文件 系统 的 运行 速度 要 稍 慢 些 ， 且 不 能 解决 文件 数据 被 覆 关 时 系统 朋 省 而 无 法 恢复 的 问 


题 。 


3) data=journa| 方 式 : 在 这 种 方式 下 ，EXT3 文 件 系 统 提 供 了 完整 的 文件 数据 和 元 数据 的 日 志 记 录 ， 再 写 入 它 的 最 终 位置 。 这 样 在 系统 崩 演 时 ， 束 可 以 通 
过 日 志 来 完全 修复 ， 保 证 文件 数据 和 元 数据 的 一 致 性 。 


2.2.6 ”EXT43 引 入 的 新 特性 


(1) 相当 大 的 文件 系统 和 更 大 的 文件 


EXT3 文 件 系统 最 多 只 能 支持 32TB 的 文件 系统 和 2TB 的 文件 ， 根 据 使 用 的 具体 架构 和 系统 设置 ， 实 际 容量 上 限 可 能 比 这 个 数字 还 要 低 ， 即 只 能 容纳 2TB 的 文 
件 系 统 和 16GB 的 文件 。 而 EXT4 的 文件 系统 容量 达到 1EB， 而 文件 容量 则 达到 16TB， 这 是 一 个 非常 大 的 数字 了 。 对 一 般 的 台式 机 和 服务 器 而 言 ， 这 可 能 并 不 重 
要 ， 但 对 于 大 型 磁盘 阵列 的 用 己 而 言 ， 这 融 非 党 重要 了 。 


(2) 更 多 的 子 目 录 数 量 

EXT3 目 前 只 支持 32000 个 子 目 录 ， 而 EXT4 取 消 了 这 一 限制 ， 理 论 上 支持 无 限 数量 的 子 目录 。 

(3) 更 多 的 块 和 inode 节 点 数量 

EXT3 文 件 系统 使 用 32 位 空间 记录 块 数量 和 inode 节 点 数量 ， 而 EXT4 文 件 系统 将 它们 扩充 到 64 位 。 
(4) 多 块 分 配 


当 数 据 写 入 EXT3 文 件 系统 中 时 ，EXT3 的 数据 块 分 配器 每 次 只 能 分 配 一 个 4KB 的 块 ， 如 果 写 一 个 100MB 的 文件 就 要 调用 25600 次 数据 块 分 配器 ， 而 EXT4 的 
多 块 分 配器 (Multiblock Allocator，MBAlloc) 支持 一 次 调用 分 配 多 个 数据 块 。 


(5) 持久 性 预 分 配 


如 果 一 个 应 用 程序 需要 在 实际 使 用 磁盘 空间 之 前 对 它 进 行 分 配 ， 大 部 分 文件 系统 都 是 通过 向 未 使 用 的 磁盘 空间 写 入 0 来 实现 分 配 的 ， 比 如 P2P 软 件 。 为 了 
保证 下 载 文件 有 足够 的 空间 存放 ， 常 音 会 预先 创建 一 个 与 所 下 载 文件 大 小 相同 的 空 文 件 ， 以 免 未 来 的 数 小 时 或 数 天 之 内 磁盘 空间 不 足 导 致 下 载 失 败 。 而 EXT4 
在 文件 系统 层面 实现 了 持久 预 分 配 并 提供 相应 的 APl， 比 应 用 软件 自己 实现 更 有 效率 。 


(6) 延迟 分 配 


EXT3 的 数据 块 分 配 策 略 是 尽快 分 配 ， 而 EXT4 的 策略 是 尽 可 能 地 延迟 分 配 ， 直 到 文件 在 缓冲 中 写 完 才 开 始 分 配 数据 块 并 写 入 磁盘 ， 这 样 束 能 优化 整个 文件 
的 数据 块 分 配 ， 显 车 提升 性 能 。 


(7) 盘 区 结构 


EXT3 文 件 系统 采用 间接 映射 地 址 ， 当 操作 大 文件 时 ， 效 率 极 其 低下 。 例 如 ， 一 个 100MB 大 小 的 文件 ， 在 EXT3 中 要 建立 25600 个 数据 块 (以 每 个 数据 块 大 
小 为 4KB 为 例 ) 的 映射 表 ; 而 EXT43 引 入 了 盘 区 概念 ， 每 个 盘 区 为 一 组 连续 的 数据 块 ， 上 述 文件 可 以 通过 盘 区 的 方式 表示 为 “该 文件 数据 保存 在 接 下 来 的 25600 
个 数据 块 中 ”， 提 高 了 访问 效率 。 


(8) 新 的 inode 节 点 结构 


EXT4 支 持 更 大 的 inode 忆 点 。 之 前 的 EXT3 默 认 的 inode 节 后 大 小 为 128 字 节 ，EXT4 为 了 在 inode 节 点 中 容纳 更 多 的 扩展 属性 ， 默 认 inode 节 点 大 小 为 256 字 
节 。 另 外 ，EXT4 还 支持 快速 扩展 属性 和 inode 节 点 保留 。 


(9) 日 志 校 验 功 能 


志 是 文件 系统 最 常用 的 结构 ， 日 志 也 很 容易 损坏 ， 而 从 损坏 的 日 志 中 恢复 数据 会 导致 更 多 的 数据 损坏 。EXT4 给 日 志 数 据 添加 了 校 验 功能 ,日志 校 验 功 
能 可 以 很 方便 地 判断 日 志 数 据 是 否 损坏 。 而 且 EXT4 将 EXT3 的 两 阶段 日 志 机 制 合 并 成 一 个 阶段 ， 在 增加 安全 性 的 同时 提高 了 性 能 。 


(10) 支持 “无 日 志 ” 模 式 
日 志 总 归 会 占用 一 些 开 销 。EXT4 人 允许 关闭 日 志 ， 以 便 某 些 有 特殊 需求 的 用 户 可 以 借 此 提升 性 能 。 
(11) 默认 启动 Barrier 


磁盘 上 配 有 内 部 缓存 ， 以 便 重 新 调整 批量 数据 的 写 操 作 顺 序 ， 优 化 写 入 性 能 ， 因 此 文件 系统 必须 在 日 志 数 据 写 入 磁盘 之 后 才能 写 Commit 记 录 。 若 
Commit 记 录 写 入 在 先 ， 而 日 志 有 可 能 损坏 ， 那 么 就 会 影响 数据 完整 性 。EXT4 文 件 系统 默认 启用 Barrier， 只 有 当 Barrier 之 前 的 数据 全 部 写 入 磁盘 ， 才 能 写 
Barrier 之 后 的 数据 。 


(12) 在 线 碎片 整理 


尽管 延迟 分 配 、 多 块 分 配 和 区 段 功能 可 以 有 效 减少 文件 的 碎片 ， 但 碎片 还 是 不 可 避免 会 产生 。EXT4 支 持 在 线 碎片 整理 ， 并 将 提供 e4defrag 工 具 进 行 个 别 
文件 或 整个 文件 系统 的 碎片 整理 。 


(13) 支持 快速 fsck 


以 前 的 文件 系统 版 本 执行 fsck 时 很 慢 ， 因 为 它 要 检查 所 有 的 inode 节 点 ， 而 EXT4 给 每 个 块 组 的 inode 节 点 表 中 都 添加 了 一 份 未 使 用 inode 节 点 的 列表 ， 所 以 
EXT4 文 件 系统 做 一 致 性 检查 时 融 可 以 跳 过 它们 而 只 检查 那些 在 使 用 的 inode 节 点 ， 从 而 提高 了 速度 。 


(14) 支持 纳 秒 级 时 间 截 


EXT4 之 前 的 扩展 文件 系统 的 时 间 截 都 是 以 秒 为 单位 的 ， 这 已 经 能 够 应 付 大 多 数 设 置 ， 但 随 着 处 理 器 的 速度 和 集成 程度 (多 核 处 理 器 ) 不 断 提升 ， 以 及 
Linux 开 始 向 其 他 应 用 领域 发 展 ，EXT4 将 时 间 戳 的 单位 提升 到 纳 秒 。 


EXT4 给 时 间 范 围 增 加 了 两 个 位 ， 从 而 让 时 间 寿 命 再 延长 ?200 年 ，EXT4 的 时 间 戳 文 持 的 日 期 达到 2514 年 4 月 25 日 ， 而 EXT3 只 达到 2038 年 1 月 18 日 。 


2.3 NTFS 


NTFS (New Technology File System) 是 微软 公司 开 友 的 具有 较 好 容错 性 和 安全 性 的 文件 系统 ， 是 Windows NT 及 之 后 的 基于 NT 内 核 友 展 的 Windows 
标准 文件 系统 ， 它 的 设计 目标 是 面向 对 数据 安全 性 等 要 求 较 高 的 商务 和 企业 级 应 用 。NFTS 的 安全 性 及 稳定 性 独树一帜 ， 其 分 区 对 用 户 权 限 做 出 了 非常 严格 的 
限制 ， 每 个 用 户 都 只 能 按照 系统 赋予 的 权限 进行 操作 ， 任 何 试图 超越 权限 的 操作 都 将 被 系统 禁止 。 同 时 它 还 提供 了 容错 结构 日 志 ， 可 以 将 用 户 的 操作 全 部 记录 
下 来 ， 从 而 保证 了 系统 的 安全 。 并 且 ，NTFSs 具 有 文件 级 修复 及 热 修 复 功 能 、 分 区 格式 稳定 、 不 易 产 生 文 件 雁 片 等 优点 ， 这 些 都 是 其 他 分 区 格式 所 不 能 企及 
的 。 这 些 优点 进一步 增强 了 系统 的 安全 性 。 


NTFS 取 代 了 FAT 文 件 系 统 ， 是 目前 微软 公司 的 Windows 系 列 操作 系统 的 主要 文件 系统 。NTFS 在 FAT 和 HPFS (高 性 能 文件 系统 ) 的 基础 上 作 了 一 系列 改 
进 (如 支持 元 数据 ) 并 且 使 用 了 更 复杂 的 数据 结构 (B+ 树 ) 以 便于 提升 性 能 、 改 善 可 靠 性 并 降低 磁盘 空间 利用 率 。NTFS 还 同时 提供 了 若干 附加 的 扩展 功能 ， 
如 访问 控制 列表 和 文件 系统 日 志 。NTFS 的 详细 设计 规范 属于 商业 秘密 ， 微 软 公司 已 经 将 其 注册 为 知识 产权 产品 ， 有 关 NTFS 的 资料 非常 少 。 因 此 ， 本 节 仅 根据 
公开 资料 对 NTFS 作 简要 介绍 。 


2.3.1 NTFS 的 重要 概念 


1) 分 区 : 分 区 是 磁盘 的 基本 组 成 部 分 ， 被 划分 的 磁盘 的 一 部 分 ， 是 一 个 能 够 被 格式 化 和 单独 使 用 的 逻辑 区 域 。 


2) 卷 : NTFS 以 卷 为 基础 ， 卷 建立 在 磁盘 分 区 乙 上 ， 当 以 NTFS 格 式 来 格式 化 磁盘 分 区 时 融 创 建 了 NTFs 卷 ， 一 个 磁盘 可 以 有 多 个 卷 ， 一 个 卷 也 可 以 由 多 个 
磁盘 组 成 。 


3) 艇 : NTFS 与 FAT32 一 样 ， 使 用 艇 作为 磁盘 空间 分 配 和 回收 的 基本 单位 ， 即 一 个 文件 占用 若干 个 整 徐 ， 而 最 后 一 艇 的 磁盘 空间 不 再 使 用 。 在 内 
部 ，NTFS 仅 引用 艇 ， 而 不 知道 磁盘 扇 区 的 大 小 。 这 样 使 NTFS 保 持 了 与 物理 扇 区 大 小 的 独立 性 ， 能 够 为 不 同 大 小 的 磁盘 选择 合适 的 艇 ， 卷 上 簇 的 大 小 ( 称 为 艇 
因子 ) 是 用 户 使 用 Format 命 令 或 其 他 格式 化 程序 格式 化 卷 时 确定 的 ， 它 随 着 卷 的 大 小 而 不 同 ， 但 都 为 物理 扇 区 的 整数 倍 。 复 的 定位 可 以 使 用 逻辑 禾 号 
(LCN) 和 虚拟 艇 号 (VCN) 。 


4) 逻辑 艇 号 (LCN) : LCN 对 卷 中 所 有 的 簇 号 从 头 到 尾 进行 简单 顺序 编号 。 


5) 虚拟 簇 号 (VCN) : VCN 对 属于 特定 文件 的 簇 从 0 到 m 编 号 ( 注 : 文件 的 总 复数 为 m+1) ， 以 便于 引用 文件 中 的 数据 ，VCN 不 要 求 在 物理 上 连续 ， 可 
以 映射 到 卷 上 任何 的 LCN。 


6) 主 文件 表 ($MFT) : 在 NTFs 中 ， 卷 中 存放 的 所 有 数据 ， 包 括 用 于 定位 和 恢复 文件 的 数据 结构 、 引 导 程 序数 据 和 记录 整个 卷 的 分 配 状态 的 位 图 ， 都 包 
含 在 一 个 称 为 主 文件 表 ($MFT) 的 文件 中 ，$MFT 是 NTFs 卷 结构 的 核心 ， 是 NTFs 最 重要 的 系统 文件 。$MFT 由 文件 记录 组 成 ， 每 个 文件 记录 的 大 小 为 1KB， 
卷 上 每 个 文件 (包括 $MFT 本 身 ) 或 者 文件 夹 在 元 文件 $MFT 中 都 有 一 条 记录 ， 个 别 的 文件 或 文件 夹 有 2 条 甚至 3 条 记录 。 


7) 文件 引用 号 : NTFS 卷 中 的 文件 是 通过 称 为 文件 引用 号 的 64 位 值 来 标识 的 。 文 件 引 用 号 由 文件 记录 号 ( 低 48 位 ) 和 文件 顺序 号 (高 16 位 ) 组 成 。 文 件 
记录 号 对 应 文件 在 $MFT 中 的 位 置 ， 顺 序号 随 文件 记录 的 使 用 而 增加 ， 从 而 使 得 NTFs 能 完成 内 部 的 一 致 性 检查 。 


8) 文件 记录 : NTFs 不 是 将 文件 仅 视 为 一 个 文本 或 二 进 制 数据 ， 而 是 将 文件 作为 许多 属性 和 属性 值 的 集合 来 处 理 ， 除 数据 属性 外 ， 其 他 文件 属性 包括 文件 
名 、 文 件 时 间 标记 、 文 件 拥有 者 等 ， 每 个 文件 或 文件 夹 在 元 文件 $4MFT 中 均 有 一 个 文件 记录 号 。 


9) 文件 名 : NTFs 中 的 每 个 文件 名 或 者 目录 名 长 度 可 达 255 字 节 ， 可 以 包含 Unicode 字 符 、 多 个 句点 和 空格 。 


10) 常 驻 属性 : 若 文 件 的 属性 值 能 直接 存储 在 $MFT 记 录 中 时 ， 该 属性 称 为 常 驻 属 性 。 在 一 般 情 况 下 ， 小 文件 或 小 目录 的 所 有 属性 均 直 接 存 储 在 $MFT 记 
录 中 。 如 果 属 性 值 直接 存放 在 $MFT 中 ， 则 NTFS 只 需 访 问 磁盘 一 次 即 可 获得 数据 。 


11) 非常 驻 属性 : 若 文件 的 内 容 (文件 体 ) 比较 大 ， 不 能 直接 存储 在 $M FT 记录 中 ， 需 要 在 $MFT 之 外 为 其 分 配 足够 的 空间 进行 存储 ， 该 属性 称 为 非常 驻 
属性 。 在 一 般 情 况 下 ， 大 文件 或 大 目录 的 记录 属性 为 非常 驻 属 性 ， 而 小 文件 或 小 目录 的 记录 属性 为 常 驻 属性 。 


12) 文件 名 索引 : 在 NTFs 中 ， 文 件 目 录 仅 仪 是 文件 名 的 一 个 索引 ， 即 为 了 便于 快速 访问 而 用 一 种 特殊 的 方式 组 织 起 来 的 文件 名 的 集合 。 要 创建 一 个 目 
录 ，NTFS 应 对 目录 中 文件 名 的 属性 进行 索引 。 


13) 数据 压缩 : NTFS 的 压缩 功能 可 以 对 单个 文件 、 整 个 目录 或 者 上 的 整个 目录 树 进 行 压缩 ，NTFS 压 缩 只 能 在 用 户 数 据 上 执行 ， 而 不 能 在 文件 系统 元 数据 
上 执行 。 数 据 压 缩 可 减少 磁盘 使 用 空间 ， 但 每 次 解压 缩 需 要 大 量 数据 运算 ， 如 果 要 复制 一 个 压缩 文件 ， 过 程 是 解压 缩 、 复 制 、 重 新 压缩 复制 文件 。 


2.3.2 ”NTFS 的 元 文件 和 总 体 布局 


从 整体 结构 上 讲 ，NTFS 由 元 文件 、 用 尸 文 件 以 及 数据 组 成 。NTFS 在 创建 时 ， 会 将 一 些 重 要 的 系统 信息 以 文件 的 形式 进行 存储 ， 和 存储 这 些 重要 信息 所 对 应 
的 文件 束 是 元 文件 ， 它 是 NTFS 最 重要 的 部 分 。 


在 NTFS 元 文件 中 最 重要 的 元 文件 就 是 y*MFT。$MFT 决 定 了 NTFS 中 所 有 文件 或 者 文件 夹 在 卷 上 的 位 置 。$MFT 是 一 个 数据 库 ， 由 一 系列 文件 记录 组 成 。 卷 
中 的 每 一 个 文件 都 有 一 个 文件 记录 号 ， 文 件 记 录 编 号 从 0 开始 ， 其 中 0 号 文件 记录 称 为 基本 文件 记录 ， 也 就 是 $MFT 本 身 。$MFT 中 的 文件 记录 大 小 一 般 是 固定 
的 ,不 管 簇 的 大 小 是 多 少 ,， 均 为 1024 字 节 。 其 中 记录 号 从 0~11 的 前 12 号 记录 是 NTFS 中 最 基本 也 是 最 重要 的 元 文件 。 除 根 目 录 外 ， 元 文件 的 文件 名 以 “$” 开 
头 ， 元 文件 是 隐藏 的 系统 文件 ， 用 户 不 能 直接 对 元 文件 进行 访问 ， 在 资源 管理 中 也 看 不 到 NTFs 的 元 文件 。 


NTFS 的 总 体 布局 如 图 2-8 所 示 。 





SBOOT | 其 他 文件 其 他 文件 其 他 文件 


图 2-8 NTFS 的 总 体 布局 


从 图 2-8 中 可 知 ，NTFS 的 元 文件 分 散 地 存储 在 逻辑 盘 (或 者 卷 ) 中 。 整 个 NTFS 是 以 艇 为 单位 来 分 配 磁盘 空间 的 。 而 在 分 区 时 ， 总 扇 区 数 不 一 定 是 簇 的 倍 
数 。 因 此 ， 可 能 会 出 现 剩余 扇 区 ， 剩 余 肩 区 一 般 大 于 或 等 于 1 个 扇 区 而 小 于 一 个 和 能。 在 FAT 格 式 的 文件 系统 中 ， 有 天 复 号 的 捐 针 (链表 ) 包含 在 FAT 链 表 中 ， 而 
在 NTFS 中 ， 有 关 艇 号 的 指针 以 数据 运行 列表 的 形式 存储 在 $MFT 中 。 


NTFS 把 磁盘 分 成 了 两 大 部 分 ， 其 中 大 约 12% 分 配给 了 $MFT， 以 满足 其 不 断 增长 的 文件 数量 。 为 了 保持 $MFT 元 文件 的 连续 性 ，$MFT 对 这 12% 的 空间 享 
有 独占 权 。 余 下 的 88% 的 空间 被 分 配 用 来 存储 文件 。 而 剩余 磁盘 空间 则 包含 了 所 有 的 物理 剩余 空间 ($MFT 剩 余 空间 也 包含 在 里 面 ) 。$M FT 空间 的 使 用 机 制 
可 以 这 样 来 描述 : 当 文 件 耗 尽 了 存储 空间 时 ，Windows 操 作 系统 会 简单 地 减少 4yMFT 空 间 ， 并 把 它 分 配给 文件 存储 。 当 有 剩余 空间 时 ， 这 些 空间 又 会 重新 被 划 
分 给 yMFT。 昌 然 系统 尽力 保持 $M FT 空间 的 专用 性 ， 但 是 有 时 不 得 不 做 出 牺牲 。 尽 管 4$M FT 碎片 有 时 是 无 法 忍受 的 ， 却 无 法 阻止 它 的 帮 生 。 


NTFS 中 15 个 重要 的 元 文件 说 明 见 表 2-3 所 列 。 


存储 在 NTFS 中 的 每 一 个 文件 或 文件 来 在 元 文件 $MFT 中 都 有 一 条 记录 ， 有 个 别 的 文件 或 文件 夹 会 有 多 条 文件 记录 ， 其 中 第 一 个 记录 称 为 基本 文件 记录 ,但 
这 种 情况 不 多 。 每 一 条 记录 的 大 小 为 1024 字 节 ， 元 文件 $MFT 中 记录 编号 从 0 开始 ， 顺 序 进行 编号 ， 其 说 明 如 表 2-3 所 示 。 


表 2-3 NTFS 中 的 元 文件 


文件 记录 号 | 元 文件 名 主要 功能 文件 记录 号 


0 $MFT 主 文件 表 本 身 9 


] $MFTMirr 0 


元 文件 名 主要 功能 
$Secure 安全 文件 
$UpCase 大 写 文件 
2 $LogFile 日 志文 件 $Extend metadata directory | 扩展 元 数据 目录 


3 Ovi 12~15 | 系统 保留 系统 保留 
$AttrDef 16~23 “| 系统 保留 系统 保留 

24 $Extend\$Quota 配额 管理 文件 

6 $Bitmap 25 

7 $Boot 26 





主 文件 表 的 部 分 镜像 


一 一 


$Extend\$ObjId 对 象 ID 文件 
$Extend\$Reparse 重 解析 文件 
用 户 文件 和 目录 


心 


0 号 记录 : 就 是 元 文件 $MFT 自 身 。 每 个 $bMFT 记 录 都 对 应 着 不 同 的 文件 ， 如 果 一 个 文件 有 很 多 属性 或 是 分 散 成 很 多 碎片 ， 就 很 可 能 需要 多 个 文件 记录 。 这 
时 ， 存 放 其 文件 记录 位 置 的 第 一 个 记录 融 叫 作 “ 基 文件 记录 ” (base file record) 。 


1 号 记录 : 是 镜像 文件 ($MFTMirr) 。 该 文件 为 元 文件 $MFT 的 前 几 条 记录 的 一 个 备份 ， 记 录 数 的 多 少 取决 于 NTFS 每 个 簇 的 扇 区 数 。 


2 号 记录 : 日 志文 件 ($LogFile) 。 该 文件 是 NTFS 为 实现 可 恢复 性 和 安全 性 而 设计 的 。 当 系统 运行 时 ，NTFS 就 会 在 日 志文 件 中 记录 所 有 影响 NTFS 卷 结构 
的 操作 ， 包 括 文件 的 创建 和 改变 目录 结构 的 命令 ， 如 复制 ， 从 而 在 系统 失败 时 能 够 恢复 NTFS 卷 。 


3 号 记录 : 卷 文 件 ($Volume) ， 它 包含 了 卷 名 、 被 格式 化 的 卷 的 NTFS 版 本 和 一 个 标明 该 磁盘 是 否 损 坏 的 标志 位 (NTFS 以 此 决定 是 否 需 要 调用 Chkdsk 
程序 来 进行 修复 ) 。 


4 号 记录 : 属性 定义 列表 ($AttrDef) ， 其 中 存放 了 卷 所 支持 的 所 有 文件 属性 ， 并 指出 它们 是 人 否 可 以 被 索引 和 恢复 等 。 


5 号 记录 : 根 目 录 (.) ， 其 中 保 仓 了 存放 于 该 卷 根 目 录 下 所 有 文件 和 目录 的 索引 。 在 访问 了 一 个 文件 后 ，NTFS 融 保留 该 文件 的 MFT 引 用 ， 第 二 次 融 能 够 
直接 进行 对 该 文件 的 访问 。 


6 号 记录 : 位 图 文件 ($Bitmap) 。NTFS 卷 的 分 配 状 态 都 存放 在 位 图 文件 中 ， 其 中 每 一 位 (bit) 代表 卷 中 的 一 能， 标识 该 篮 是 空闲 的 还 是 已 被 分 配 了 的 ， 
由 于 该 文件 可 以 很 容易 地 被 扩大 ， 所 以 NTFS 卷 可 以 很 方便 地 动态 扩大 ， 而 FAT 格 式 的 文件 系统 由 于 涉及 FAT 的 变化 ， 所 以 不 能 随意 地 对 分 区 大 小 进行 调整 。 


7 号 记录 : 引导 文件 ($Boot) ， 它 是 另 一 个 重要 的 系统 文件 ， 存 放 着 系统 的 引导 程序 代码 。 该 文件 必须 位 于 特定 的 磁盘 位 置 才能 够 正确 地 引导 系统 。 该 
文件 是 在 Format 程 序 运 行 时 创建 的 ， 这 正体 现 了 NTFS 把 磁盘 上 的 所 有 事物 都 看 成 文件 的 原则 。 这 也 意味 着 虽然 该 文件 享受 NTFS 的 各 种 安全 保护 ， 但 还 是 可 
以 通过 普通 的 文件 |/O 操 作 来 修改 。 


8 号 记录 : 坏 篮 文件 ($BadClus) ， 它 记录 了 磁盘 上 该 卷 中 所 有 损坏 的 簇 号， 防止 系统 对 其 进行 分 配 使 用 。 


9 号 记录 : 安全 文件 ($Secure) ， 它 存储 了 整个 卷 的 安全 描述 符 数 据 库 。NTFS 文 件 和 目录 都 有 各 自 的 安全 描述 符 ， 为 了 节省 空间 ，NTFS 将 具有 相同 描 
述 符 的 文件 和 目录 和 存放 在 一 个 公共 文件 中 。 


10 号 记录 : 大 写 文件 ($UpCase) ， 该 文件 包含 一 个 大 小 写字 符 转换 表 。 
11 号 记录 为 扩展 元 数据 目录 ($Extended metadata directory) ; 12 号 记录 ~ 23 号 记录 为 系统 保留 ; 24 号 记录 为 配额 管理 文件 ($EXTend\$Quota) ; 


25 号 记录 为 对 象 ID 文 件 ($EXTend\$Objld) ; 26 号 记录 为 重 解析 文件 ($EXTend\$Reparse) ; 27 号 以 后 是 用 户 文件 和 目录 。 


2.3.3 ”NTFS 的 引导 局 区 


NTFS 的 引导 扇 区 ( 即 DBR) 和 FAT32 的 引导 扇 区 作用 相同 ， 占 1 个 扇 区 的 位 置 ， 从 NTFS 的 分 区 表 可 以 计算 出 DBR 在 整个 物理 磁盘 中 的 位 置 ，DBR 是 NTFS 
中 元 文件 $Boot 的 重要 组 成 部 分 。 


DBR 完 成 定义 分 区 参数 和 引导 系统 的 作用 。 在 FAT32 文 件 系统 中 ， 即 使 文件 不 正确 ， 而 DBR 的 引导 记录 正常 ， 系 统 会 显示 没有 错误 。 与 FAT32 文 件 系统 不 
同 ，NTFS 分 区 的 DBRi 记 录 不 是 分 区 正确 与 否 的 充分 条 件 ， 因 为 只 有 $MFT 中 的 系统 记录 (如 元 文件 $4MFT 等 ) 正常 ， 该 分 区 才能 正常 访问 ，NTFS 的 定义 见 表 
2-4 所 列 。 


表 2-4 NIFS 中 DBR 的 结构 


字 市 偏 移 字 人 节 数 含 义 

0X00 跳 转 指令 

0X02 空 操 作 指 令 

0X03 8 厂商 标志 ， 一 般 为 NTFS， 不 足 补 空格 
0X0B 每 个 扇 区 的 字 节 数 

0X0D ”1 | 每 个 马 的 扇 区 数 ， 该 值 取 值 为 1、 2、4、8、16、32、64 或 128 
OXOE 保留 局 区 (NTFS 不 用 ， 一般 为 00 ) 

0X10 总 为 00 

0X13 NTFS 未 使 用 ,为 00 

OX16 总 为 00 

0X18 每 个 磁道 的 肩 区 数 

0X1C 隐藏 房 区 数 

0X20 NTFS 未 使 用 ， 一 般 为 00 

0X24 NTFS 未 使 用 ， 总 为 0X 

0X28 ”8 | 扇 区 总 数 ， 比 分 区 表 中 的 扇 区 总 数 少 1 个 肩 区 
0X30 ”8 | 元 文件 SMFT 的 起 始 秘 号 

0X38 同 元 文件 $SMFTMirr 的 起 始 簇 号 

0X40 每 个 $SMFT 记录 大 小 的 描述 

到 # 

0X44 每 个 索引 节点 大 小 的 描述 

vs A 

0X50 校 验 和 ， 一 般 为 00 

0X54 引导 记录 

OX1FE 签名 ， 一 般 为 AA55， 存储 形式 为 “55 AA” 


2.3.4 ”NTFS 的 文件 存储 特性 


NTFS 在 磁盘 上 写 入 文件 数据 的 时 候 ， 有 两 种 存储 方式 ， 即 常 驻 和 非常 驻 。 
1.NTFS 的 常 驻 属性 


如 果 一 个 文件 很 小 ， 文 件 的 所 有 属性 和 属性 的 值 (其 中 包括 文件 的 数据 ) ， 就 全 部 存放 在 文件 的 $MFT 的 文件 记录 中 。 当 属性 值 能 直接 存放 在 $MFT 中 
时 ,该 属性 就 称 为 常 驻 属性 。 有 些 属性 总 是 常 驻 的 ， 这 样 NTFS 才 可 以 确定 其 他 非常 驻 属性 。 例 如 ， 标 准 信 息 属性 和 根 索 引 就 总 是 常 驻 属性 。 


每 个 属性 都 是 以 一 个 标准 头 开 始 的 ， 在 标准 头 中 包含 该 属性 的 信息 和 NTFS 通 常用 来 管理 属性 的 信息 。 该 标准 头 总 是 常 驻 的 ， 并 记录 着 属性 值 是 否 常 驻 ， 
对 于 常 驻 属 性 ， 标 准 头 中 还 包含 属性 值 的 偏 移 量 和 属性 值 的 长 度 。 


如 果 属 性 值 能 直接 存放 在 $MFT 中 ， 那 么 NTFS 对 它 的 访问 时 间 就 将 大 大 缩短 。NTFS 只 需 访 问 磁盘 一 次 ， 就 可 立即 获得 数据 ;而 不 必 像 FAT 文 件 系统 那 
样 ， 先 在 FAT 中 查找 文件 ， 再 读 出 连续 分 配 的 单元 ， 最 后 找到 文件 的 数据 。 


2.NTFS 的 非常 驻 属性 


大 文件 或 大 目录 的 所 有 属性 就 不 可 能 都 常 驻 在 $MFT 中 。 如 果 一 个 属性 (如 文件 数据 属性 ) 太 大 而 不 能 存放 在 只 有 1KB 的 $MFT 文 件 记录 中 时 ，NTFS 将 从 
$MFT 之 外 分 配 区 域 。 这 些 区 域 通常 称 为 一 个 运行 (run) 或 一 个 区 段 (Extent) ， 它 们 可 用 来 存储 属性 值 ， 如 文件 数据 。 如 果 以 后 属性 值 又 增加 ， 那 么 NTFS 


将 会 再 分 配 一 个 运行 ， 以 便 用 来 存储 额外 的 数据 。 值 存储 在 运行 中 而 不 是 在 $M FT 文件 记录 中 的 属性 称 为 非常 驻 属性 。NTFSs 决 定 了 一 个 属性 是 常 驻 还 是 非常 驻 
的 ; 而 属性 值 的 位 置 对 访问 它 的 进程 而 言 是 透明 的 。 


当 一 个 属性 为 非常 驻 属 性 时 ， 如 大 文件 的 数据 ， 它 的 头 部 将 包 合 NTFS 需 要 在 磁盘 上 定位 该 属性 值 的 有 关 人 信息。 图 2-9 显 示 了 一 个 存储 在 两 个 运行 中 的 非常 
驻 属性 。 








标准 信息 | 文件 名 数据 HPFS 扩 展 属性 





图 2-9 ”存储 在 两 个 运行 中 的 非常 驻 属性 


在 标准 属性 中 ， 只 有 可 以 增长 的 属性 才 是 非常 驻 的 。 对 文件 来 说 ， 可 增长 的 属性 有 数据 、 属 性 列表 等 。 标 准 信 息 和 文件 名 属性 总 是 常 驻 的 。 


24 CDFS 


CDFS 即 光盘 (CD-ROM) 文件 系统 ， 是 为 了 兼容 计算 机 上 现 有 的 文件 系统 而 定义 的 ， 专 门 针对 CD 格式 的 一 种 文件 系统 。1985 年 ， 飞 利 浦 、 索 尼 、 芋 
果 、 微 软 等 12 家 公司 制定 了 一 个 跨 平台 的 CD-ROM 文 件 系统 标准 ， 称 为 High Sierra 文 件 系 统 ，High Sierra 文 件 系统 的 出 现 解决 了 由 于 CD-ROM 文 件 系统 不 同 
而 限制 信息 交换 的 问题 。High Sierra 文 件 系统 很 快 被 CD-ROM 厂 商 所 接受 ， 并 且 经 国际 标准 化 组 织 (1SO) 进行 改进 后 于 1988 年 颁布 ， 命 名 为 
ISO9660，1SO9660 标 准 对 CD-ROM 光 盘 上 存储 数据 文件 的 逻辑 格式 和 结构 进行 了 明确 的 规定 ， 实 现 了 不 同 操作 系统 之 间 的 数据 交换 。 


2.4.1 逻辑 仔 储 结构 


光盘 文件 系统 的 格式 包括 物理 格式 和 逻辑 格式 ， 物 理 格式 规定 数据 如 何 存 放 在 光盘 上 ， 包 括 物 理 扇 区 地 址 、 数 据 类 型 、 数 据 块 大 小 、 错 误 检测 和 校正 码 
等 ， 人 逻辑 格式 又 称 为 文件 格式 ， 规 定 了 如 何 将 文件 组 织 到 光盘 上 以 及 指定 文件 在 光盘 上 的 物理 位 置 ， 包 括 文件 的 目录 结构 、 文 件 大 小 及 所 需 的 盘 片 数目 。 由 于 
CD-ROM 与 磁盘 的 特性 不 同 ， 因 此 在 定义 CD-ROM 逻 辑 格式 时 与 定义 磁盘 的 逻辑 格式 有 差异 。 考 虑 到 CD-ROM 的 只 读 性 ， 不 需要 定义 与 写 有 关 的 操作 ， 如 对 
文件 和 文件 目录 进行 删除 、 添 加 和 重 命名。 


对 CD-ROM 的 逻辑 结构 的 摘 述 从 以 下 几 个 方面 展开 。 
1. 局 区 


CD-ROM 一 个 物理 肩 区 共有 2352 字 节 ， 除 去 12 个 同步 字 节 、4 个 记录 扇 区 地 址 的 字 节 以 及 288 个 用 作 错 误 检 测 和 校正 的 字 节 后 ， 还 剩 下 2048 字 节 用 于 存放 
用 户 数据 。 将 2048 字 节 的 数据 域 定 义 为 一 个 逻辑 扇 区 ， 且 每 个 逻辑 扇 区 都 有 唯一 的 逻辑 扇 区 号 (Logical Sector Number，LSN) 进行 标识 ， 逻 辑 扇 区 的 大 小 
也 可 以 自 定义 ， 但 大 小 要 等 于 2n，n 为 正 整数 。 


一 个 逻辑 肩 区 又 可 以 分 成 一 个 或 多 个 逻辑 块 ， 每 个 逻辑 块 也 都 有 目 己 的 编号 (Logical Block Number，LBN) 进行 标识 ,逻辑 块 的 大 小 也 可 以 自 定义 ， 
但 大 小 要 等 于 2n， 且 不 能 超过 扇 区 的 大 小 。 


物理 扇 区 、 逻 辑 扇 区 与 逻辑 块 的 关系 如 图 2-10 所 示 。 


多 辑 夯 区 
(由 一 个 或 多 个 逻辑 块 组 成 ) 





和 
TU 


物理 而 区 


图 2-10 ”物理 扇 区 、 逻 辑 扇 区 与 远 辑 块 的 关系 
2. 文 件 


每 个 文件 可 分 为 一 个 或 者 多 个 文件 节 ， 一 个 文件 节 放 在 由 许多 个 逻辑 块 组 成 的 文件 空间 里 ， 这 些 逻 辑 块 被 顺序 编号 ， 组 成 的 文件 空间 又 称 为 文件 域 。 一 个 
较 大 的 文件 可 以 分 成 多 个 文件 节 ， 分 别 存储 在 多 片 CD-ROM 盘 的 文件 域 中 ;一 个 中 等 大 小 的 文件 可 以 分 成 若干 文件 节 ， 和 存储 在 一 片 CD-ROM 盘 的 多 个 文件 域 
中 ; 小 文件 不 需要 分 文件 域 ， 人 存放 在 单个 文件 节 中 即 可 。 


光盘 上 的 文件 标识 符 由 文件 名 、 文 件 后 缀 名 和 文件 版 本 号 组 成 ， 其 中 文件 名 和 文件 后 缀 名 是 必需 的 ， 文 件 标识 符 只 能 由 大 写字 母 A ~Z、 数 字 0 ~ 9 以 及 下 
划 线 组 成 。 在 DOS 环 境 下 ， 文 件 名 不 能 超过 8 个 字符 ， 文 件 后 级 名 不 能 超过 3 个 字符 。 


3. 目 录 


光盘 文件 系统 采用 隐 式 分 层 目录 形式 ， 由 于 CD-ROM 是 只 读 的 ， 无 须 提 供 对 目录 的 增加 或 删除 等 操作 ， 相 对 于 一 般 磁 盘 文件 系统 的 显 式 分 层 目录 形式 ， 
隐 陈 分 层 目录 形式 能 减少 查找 文件 时 的 时 间 人 花费 。 在 这 种 目录 结构 下 ， 文 件 的 目录 也 被 看 成 一 个 文件 ， 把 包含 目录 的 文件 称 为 目录 文件 。 


目录 文件 由 一 组 长 度 可 变 的 目录 记录 组 成 ， 每 个 目录 记录 由 多 个 记录 域 组 成 ， 记 录 域 中 包含 了 有 天 该 文件 的 各 项 信息 ， 如 文件 标识 、 文 件 段 及 其 扩展 属性 
记录 的 位 置信 息 等 ， 具 体 如 表 2-5 所 示 : 


表 2-5 目录 记录 的 格式 


字 节 位 置 记录 域 的 名 称 
| 目录 记录 长 度 (LEN_DR) 
2 扩展 属性 记录 (XAR) 长 度 
3~10 文件 域 地 址 
11~18 数据 长 度 
19~25 日 期 和 时 间 
26 文件 标识 
7 文件 单元 大 小 
ps 交叉 间隔 大 小 
29~32 卷 顺序 号 
33 文件 标识 符 长 度 (LEN _FI) 
34 (33+LEN FT) 文件 标识 符 
34 ~ LEN FI 填充 域 
(34+LEN FI+1) ~ LEN DR 系统 使 用 (保留 ) 


如 果 一 个 文件 被 分 散在 多 个 文件 域 中 时 ， 则 需要 设置 多 个 目录 记录 ， 每 个 目录 记录 都 需要 给 出 相应 的 文件 域 地 址 ， 并 且 标 识 出 该 文件 域 是 否 是 最 后 一 块 。 
每 个 目录 记录 不 能 横 跨 两 个 逻辑 扇 区 ， 当 一 个 目录 在 这 个 逻辑 扇 区 中 放 不 下 的 时 候 ， 应 该 移 到 后 一 个 逻辑 扇 区 中 。 


目录 文件 、 目 录 记 录 和 记录 域 的 天 系 如 图 2-11 所 示 。 


目录 具有 层次 结构 ， 一 个 目录 层次 树 中 有 一 个 根 目录 ， 人 在 基本 卷 描 述 符 或 辅助 卷 摘 述 符 中 进行 标识 ， 其 他 每 个 目录 都 由 其 对 应 的 父 目 录 中 的 一 个 记录 进行 
标识 ， 另 外 每 个 目录 也 都 有 一 个 记录 用 来 指出 它 的 父 目 录 。 目 录 层 次 树 中 有 多 个 层 ， 根 目录 是 第 一 层 ， 目 录 树 的 层 数 不 能 超过 8。 


目录 文件 
记录 1 记录 2 记录 3 记录 4 记录 i 
目录 记录 | 文件 A | 文件 B | 文件 B | 文件 B | _//。 | 文件 N| 
逻辑 块 号 ~- 
250 231 232 233 2314 400 401 402 403 404 900 901 902 903 904 
XAR | 文件 A: 文件 域 文件 B: 文件 域 1 文件 B: 文件 域 2 
1 2 3 4 “1 2 3 4 5 6 7 8 9 10 


299 300 301 302 303 304 


文件 B: 文件 域 3 | 


ll 12 13 14 15 





图 2-11 目录 文件 、 目 录 记 录 和 记录 域 的 关系 


路 径 表 的 提出 主要 是 为 了 解决 目录 谍 套 层 数 太 深 而 导致 文件 查询 时 间 过 长 的 问题 ， 路 径 表 由 多 个 路 径 记 录 组 成 ， 每 个 路 径 记 录 分 别 对 应 根 目录 和 各 个 子 目 
录 ， 路 径 记 录 中 包含 了 各 子 目 录 的 开始 地 址 即 逻辑 块 号 LBN， 这 样 通过 路 径 表 就 可 以 快速 访问 每 一 个 子 目 录 。 


具体 的 目录 结构 与 路 径 表 如 图 2-12 所 示 。 


(_) 文件 





图 2-12 ”目录 结构 与 路 径 表 的 关系 


由 图 2-12 可 以 看 出 ,每 张 路 径 表 用 来 描述 一 个 目录 树 ， 对 于 目录 树 中 的 每 个 目录 ( 根 目录 除外 ) 都 有 一 个 相应 的 记录 标识 出 该 目录 及 其 父 目 录 ， 也 给 出 该 
目录 的 位 置信 息 。 路 径 表 中 的 记录 编号 从 1 开始 ， 其 中 第 一 个 记录 用 来 指出 根 目 录 及 其 位 置 ， 一 个 目录 的 目录 号 就 是 路 径 表 中 标识 该 目录 的 记录 的 序号 。 路 径 
表 记 录 的 格式 如 表 2-6 所 示 。 

表 2-6 路 径 表 记录 格式 


字 节 位 置 记录 域 的 名 称 
] 目录 标识 符 的 长 度 (LEN_DIT) 
2 扩展 属性 记录 (XAR ) 的 长 度 
3 存放 目录 的 地 址 
1 父 目 录 号 
9~ (8+LEN DI) 目标 标识 符 (不 超过 31 个 字符 ) 
( 9+LEN _ DI) 填充 域 


5. 卷 


记录 CD-ROM 盘 所 含 信息 的 结构 称 为 卷 ， 在 |ISO9660 标 准 中 ， 一 张 CD-ROM 称 为 一 个 卷 ， 一 个 应 用 软件 通常 由 多 个 文件 组 成 ， 对 于 一 个 小 的 应 用 软件 ， 
一 卷 可 能 包含 多 个 文件 ， 对 于 一 个 中 等 的 应 用 软件 ， 一 卷 可 能 包含 一 个 文件 ;对 于 一 个 较 大 的 应 用 软件 ， 可 能 需要 多 个 卷 才 能 包含 一 个 文件 。 


卷 被 分 为 系统 区 和 数据 区 两 部 分 ， 其 中 LSN0 ~ LSN15 为 系统 区 ， 从 LSN16 开 始 到 最 后 一 个 LSN 为 数据 区 ， 数 据 区 主要 记录 卷 描述 符 、 文 件 目录 、 数 据 文 
件 等 信息 。 其 中 LSN16 为 卷 搞 述 符 ， 主 要 用 于 摘 述 卷 空 间 、 卷 的 属性 、 根 目录 及 路 径 表 的 位 置 、 卷 空间 的 划分 等 信息 。 卷 摘 述 符 主要 分 为 五 种 类 型 ， 分 别 为 主 
卷 摘 述 符 、 辅 助 卷 摘 述 符 、 卷 划分 描述 符 、 引 导 记 录 、 卷 摘 述 符 集 结束 符 。 其 中 前 四 种 摘 述 符 可 以 任意 组 合 ， 形 成 卷 描述 符 序 列 ， 卷 摘 述 符 序 列 应 该 遵循 以 下 
规则 : 序列 中 主 卷 搞 述 符 应 该 至 少 出 现 一 次 ， 卷 质 述 符 集结 束 符 只 能 出 现 一 次 ， 并 且 只 能 出 现在 最 后 。 卷 摘 述 符 的 结构 如 表 2-7 所 示 。 


表 2-7 ” 卷 描 述 符 格式 


字 节 位 置 域 名 


1 卷 搞 述 符 的 类 

2~6 标准 卷 标 识 符 (CD001 ) 
7 卷 描述 符 版 本 (0x01 ) 
8~2048 依赖 于 卷 描述 符 类 型 


由 表 2- 7 可 知 ， 卷 摘 述 符 是 一 个 由 2048 字 节 组 成 的 固定 长 度 记 录 ， 卷 摘 述 符 结 构 根 据 卷 摘 述 符 类 型 的 不 同 而 不 同 ， 其 中 第 一 字 节 是 卷 质 述 符 的 类 型 ， 取 值 
范围 如 表 2-8 所 示 。 


表 2-8 卷 描 述 符 类 型 区 对 应 值 


类 型 区 值 描述 符 种 类 
0 引导 记录 
| 主 卷 描述 符 
< 辅助 卷 描 述 符 
3 卷 划 分 描述 符 
4~254 保留 区 
D55 卷 描述 从 集结 束 符 


由 表 2-8 可 知 ， 卷 摘 述 符 类 型 255 (0xff) 表示 这 是 卷 描 述 符 序列 最 后 的 结束 符 ， 卷 描述 符 类 型 4~254 是 保留 的 ，1 表 示 是 主 卷 描述 符 ， 由 于 主 卷 描述 符 提 
供 了 卷 的 信息 、 特 点 、 文 件 系统 逻辑 块 大 小 等 一 系列 的 信息 ， 因 此 需要 对 主 卷 摘 述 符 的 内 容 进行 研究 。 主 卷 描 述 符 的 具体 结构 如 表 2-9 所 示 。 


表 2-9 主 卷 描述 符 结 构 


字 节 位 主 卷 描述 符 记 录 域 的 名 称 
| 卷 描 述 符 的 类 型 
2~6 标准 卷 摘 述 从 (CD001) 
7 卷 描 述 符 版 本 号 
8 未 使 用 (00 ) 
9~10 系统 标识 符 
11~72 卷 标 识 符 
73~80 未 使 用 ( 00) 
81~88 卷 空间 大 小 
89~120 未 使 用 (00 ) 
121~124 卷 集 大 小 
125~128 卷 顺序 号 
129~132 逻辑 块 大 小 
133~140 路 径 表 大 小 
141~144 L 型 路 径 表 值 位 置 
145~148 L 型 路 径 表 任 选 值 位 置 
149~152 M 型 路 径 表 值 位 置 
153~156 M 型 路 径 表 任 选 值 位 置 
157~190 根 目 录 的 目录 记录 
191~318 卷 集 标识 符 
319~446 出 版 商标 识 符 
447~574 数据 准备 者 标识 符 

( 续 ) 

字 节 位 主 卷 描 述 符 记录 域 的 名 称 
575~702 应 用 软件 标识 符 
703~739 版 权 文件 标识 符 
740~776 文摘 标识 符 
777~813 文摘 目录 文件 标识 符 
814~830 卷 创作 日 期 和 时 间 
831~847 卷 修改 日 期 和 时 间 
848~864 卷 到 期 日 期 和 时 间 
865~881 卷 有 效 日 期 和 时 间 
882 文件 结构 版 本 号 
883 (保留 ) 
884~1395 应 用 程序 使 用 
1396~2048 (保留 ) 


其 中 仿 移 位 置 156 字 节 处 ， 有 一 个 长 度 为 34 字 节 的 记录 域 ， 即 根 目录 的 目录 记录 ， 通 过 解析 根 目录 的 目录 记录 ， 可 以 找到 根 目 录 下 的 所 有 文件 或 目录 ， 从 
而 读 取出 相应 的 信息 。 


6. 多 字 节 数据 的 存储 


在 ISO9600 中 ， 对 16 位 二 进 制 数 和 32 位 二 进 制 数 分 别 定义 了 以 下 几 种 存储 方式 。 
(1) 16 位 二 进 制 在 CD-ROM 上 的 三 种 存储 方式 
Little Endian Word: 两 个 连续 字 节 ， 低 字 节 在 先 。 
. Big Endian Word: 两 个 连续 字 节 ， 高 字 节 在 先 。 
. Both Endian Word: 四 个 连续 字 节 ， 前 两 字 节 用 Little Endian Wotd 方 式 存储 ， 后 两 字 节 用 Big Endian Word 方 式 存储 。 
(2) 32 位 二 进 制 在 CD-ROM 上 的 三 种 存储 方式 
.Little Endian Double Word: 四 个 连续 字 节 ， 低 字 节 在 先 。 
` Big Endian Double Word: 四 个 连续 字 节 ， 高 字 节 在 先 。 


* Both Endian Double Word: 和 八 个 连续 字 节 ， 前 四 字 节 用 Little Endian Double Wotd 方 式 存储 ， 后 四 字 节 用 Big Endian Double Wotd 方 式 存储 。 


2.4.2 CD-ROM 上 数据 的 定位 


主要 有 两 种 方法 来 定位 CD-ROM 上 的 一 个 文件 记录 ， 一 种 方法 是 使 用 路 径 表 进行 搜索 ， 另 一 种 方法 是 搜索 完整 的 目录 结构 ， 比 较 方便 和 快捷 的 方法 是 缓 
仔 路 径 表 ， 然 后 在 需要 时 下 载 目录 。 在 这 里 主要 介绍 如 何 通 过 人 遍历 根 目录 来 进行 文件 及 目录 的 搜索 ， 具 体 的 流程 阐述 如 下 。 


CD-ROM 上 的 卷 分 为 系统 区 和 数据 区 ， 其 中 LSN0~LSN15 为 系统 区 ，LSN16 到 最 后 一 个 LSN 为 数据 区 ， 即 光盘 的 前 32768 (16x2048) 字 节 为 系统 区 ， 
换 成 十 六 进 制 就 是 0x8000， 即 数据 区 从 0x8000 开 始 。 文 件 系 统 的 逻辑 扇 区 格式 如 表 2-10 所 示 。 


表 2-10 主 卷 描述 符 结 构 


ISO 9660 文件 系统 
系统 区 ( 32768B ) 未 被 1SO 9660 使 用 


数据 区 卷 描 述 符 集 绪 束 符 ( 2048B) 
可 选 空间 
根 目录 条 目 


由 表 2-10 所 示 ， 数 据 区 从 0x8000 开 始 ， 由 于 主 卷 摘 述 符 中 包含 了 关于 卷 的 信息 、 文 件 系 统 逻 辑 块 等 一 系列 的 内 容 ， 因 此 需要 在 数据 区 中 找到 主 卷 描述 符 
并 且 进 行 解析 。 数 据 区 开头 便 是 一 系列 的 描述 符 ， 描 述 符 的 类 型 通过 表 2-8 中 的 卷 描述 符 类 型 区 对 应 值 来 进行 区 分 ， 通 过 判断 卷 描述 符 的 第 一 字 节 是 不 

1” 可 以 找到 主 卷 摘 述 符 。 

找到 主 卷 描述 符 后 ， 可 以 通过 解析 主 卷 摘 述 符 找 到 对 应 的 目录 文件 系统 ， 主 卷 描 述 符 的 信息 非 钊 多 ， 如 表 2-9 中 所 示 ， 主 要 关注 仿 移 1256 位 置 处 长 度 为 34 
字 蔬 的 变量 ， 即 127~ 190 字 节 处 的 根 目录 的 目录 记录 。 其 中 几 个 重要 的 变量 如 表 2-11 所 示 。 


表 2-11 目录 记录 中 几 个 重要 变量 的 含义 


字 节 位 置 记录 域 的 名 称 
| 目录 记录 长 度 (LEN_DR) 
3~10 文件 域 地 址 
11~18 数据 长 度 
33 文件 标识 符 长 度 (LEN _FI ) 
34 ( 33+LEN FI) 文件 标识 符 


由 于 根 目录 的 目录 记录 为 34 字 节 ， 即 目录 记录 长 度 变 量 为 0x22， 查 找 0x8000 地 址 后 的 内 容 ， 与 0x22 值 匹配 的 记录 为 对 应 的 根 目 录 信 息 ， 如 图 2-13 所 示 。 


81. | 98686668696 88 98 696 9 9 96 96 16 69 99 69 8 22 99 18 68 |............ 
82. | 9866686ae 88 88 99 808 699 18 88 868 69 88 88 869 68 66 71 6c |.............. q.| 
83. | 96866686be 69 81 84 2f 28 92 99 69 981 99 88 91 91 696 28 28 |.../ ......... | 


图 2-13 ”对 应 目录 记录 相应 内 容 


如 图 2-13 所 示 ，0x00008090 开 始 的 第 一 行 中 “22” 对 应 的 地 方 ， 表 明 目 录 记 录 长 度 为 0x22， 即 有 34 字 节 ， 与 根 目录 的 目录 记录 相 匹 配 ， 查 看 第 34 字 节 位 
置 处 ， 文 件 标识 符 为 “/”。 第 3~10 字 节 位 置 处 的 8 字 节 表示 文件 域 的 地 址 ， 这 8 字 节 以 Both Endian Double Word 格 式 存 储 ， 前 四 字 书 为 小 端 LBA 号 (逻辑 
区 块 地 址 ) ， 后 四 字 节 为 大 端 LBA 号 ， 因 此 “1800000000000018” 表明 LBA 号 为 0x18， 对 于 目录 ， 指 向 的 是 一 个 数组 ; 对 于 文件 ， 存 储 的 是 相应 的 文件 内 
容 。 计 算 偏 移 Gx18= (24) 10，24x2048=0x18x0x800=0xc000， 对 应 找到 0x0000c000 地 址 处 的 内 容 ， 如 图 2-14 所 示 。 


81. | 68666C6686 38 99 18 686088888080 68188 868868688688 |................ | 
82. | 6666Cc919 88 988 71 8cC 89 81 84 2f 29 92 99 99 91 99 9680 91 |..q..../ ....... | 
83. | 68666C629 081 88 53 58 87 81 be ef 88 52 52 85 81 81 58 58 |..SP..... RR. . .PX| 
84. | 8888c838 2cC 81 ed 41 9 88 86 9 41 ed 92 88 696 868 88 |,..A 凡 。。。。。。。 | 
85. | 8080c840 688 92 e8 93 88 88 88 9698 63 e8 e8 93 60 99 698 68 |................ | 
86. | 98666C658 83 €8 18 88 88 988 80 69 18 54 46 1a 81 ge 71 |.......... Tl 
87. | 8088Cc868 BCc 89 981 84 2f 28 71 8a 86 83 39 2€e 28 71 BC 89 | Fu 
88. | 68666c6796 81 64 2f 28 43 45 1C 81 19 996 80 6808088 19 |../ CE.......... | 


图 2-14 ”对 应 文件 域 地 址 相应 内 容 


分 析 图 2-14 中 的 文件 信息 可 知 ， 目 录 记 录 长 度 为 0x90， 第 3~10 字 节 表 示 对 应 的 文件 域 地 址 ，1800000000000018 表 明 逻 辑 区 块 地 址 LBA 号 为 0x18， 由 于 
指向 的 LBA 号 小 于 等 于 自身 的 LBA 号 ， 将 其 略 过 ， 直 到 找到 指向 LBA 号 大 于 自身 LBA 号 的 文件 ， 如 图 2-15 所 示 地 址 的 文件 。 


81. | 9666C6ef6 9a 86 83 39 2e 28 71 6C 89 81 64 2f 28 69 84 60 |...9. q..../ ...| 
82. | 8088c160 1b 88 98 88 99 66 80 1b 88 92 88 99 86 9680 82 868 |,................| 
83. | 6666C1196 71 6865 89 91 64 2e 20 80 68 808 81 99 88 81 9a 42 |q..... ........B| 
84. | 8088Cc128 4f 4f 54 2e 42 49 4e 3b 31 88 52 52 85 81 89 4e |0O0T.BIN;1.RR...N| 


图 2-15 ”对 应 文件 域 地 址 相应 内 容 


如 图 2-15 所 示 ， 第 一 行 “84” 值 位 置 处 为 起 始 地 址 ， 其 后 的 第 3~10 字 节 为 对 应 的 文件 域 地 址 ，1b0000000000001b 表 明 LBA 号 为 0x1b， 由 此 可 计算 对 应 
文件 的 偏 移 地 址 。 第 11~18 字 节 为 数据 长 度 ，0002000000000200 表 明文 件 大 小 为 0x200， 即 文件 大 小 为 512 字 书 。 第 33 字 节 为 文件 标识 符 的 长 度 ， 表 示 0x0a 
字 忆 都 是 文件 名 ， 即 文件 名 为 “BOOT.BIN; 1”， 由 于 ISO 和 存储 文 件 会 自动 把 文件 后 面 加 上 “; 1”， 并 且 将 小 写 转换 为 大 写 ， 因 此 需要 我 们 自己 对 得 到 的 文 
件 名 进行 处 理 ， 然 后 可 以 根据 LBA 号 和 文件 大 小 将 对 应 的 文件 取出 。 


利用 以 上 摘 述 的 方法 ， 壳 历 所 有 的 文件 ， 便 可 以 得 到 CD-ROM 上 的 相 天 文件 目录 信息 。 
2.4.3 ”CDFS 的 改进 


文件 系统 一 般 是 操作 系统 的 核心 ， 不 同 的 操作 系统 其 文件 系统 也 不 相同 ， 对 于 CD-ROM ， 由 于 它 的 只 读 性 及 其 文件 组 织 形 式 也 与 其 他 文件 系统 有 所 不 
同 ，1988 年 国际 标准 化 组 织 (I1SO) 颁布 了 Il399660 标 准 ， 对 CD-ROM 光 盘 上 存储 数据 文件 的 逻辑 格式 和 结构 进行 了 明确 的 规定 ， 实 现 了 不 同 操作 系统 乙 间 的 
数据 交换 。 


1.1SO9660 


1ISO9660 是 目前 被 最 广泛 支持 的 光盘 文件 系统 ， 能 被 所 有 的 主流 操作 系统 识别 ,支持 “8+3” 格 式 的 文件 名 ， 目 录 层 次 深度 不 能 超过 8 级 。 由 于 没有 一 个 
操作 系统 在 一 开始 束 被 设计 成 能 识别 |SO9660 标 准 光盘 上 存储 的 数据 ， 因 此 每 个 操作 系统 都 需要 开发 出 针对 1SO9660 的 扩展 驱动 程序 ， 以 实现 |ISO9660 与 各 操 
作 系 统 之 间 的 信息 转换 ， 方 便 用 户 直 接 查看 CD-ROM 盘 上 的 文件 。 


微软 公司 开发 了 针对 DOS 操 作 系 统 的 MSCDEX (Microsoft CD-ROM Extension) 扩展 驱动 程序 ， 与 CD-ROM 了 驱动 器 生产 厂家 提供 的 硬件 设备 驱动 程序 
配合 ， 能 够 将 ISO9660 格 式 光 盘 上 的 文件 转化 为 DOS 上 可 以 识别 的 数据 。 苹 果 公 司 开发 了 专门 针对 Macintosh 操 作 系 统 的 Foreign File Access 扩 展 驱 动 程序 ， 
可 以 以 HFS (Hierarchical File System) 的 格式 读 取 1SO9660 格 式 光 盘 上 的 数据 。 由 于 1SO9660 的 跨 平台 通用 性 ， 使 得 用 户 可 以 在 多 种 操作 系统 上 访问 CD- 


ROM 光 盘 ， 推 动 了 CD-ROM 的 发 展 和 使 用 。 
2.UDF 


UDF 又 称 为 通用 磁盘 格式 (Universal Disc Format) ， 它 主要 是 针对 1SO9660 文 件 结构 的 CD-R 光 盘 不 能 追加 刻录 新 的 数据 的 缺点 而 进行 改进 的 ， 由 于 
ISO9660 文 件 系统 主 要 针对 CD-ROM 只 读 型 光盘 而 制定 ， 因 此 光盘 上 的 数据 和 文件 结构 已 经 确定 ， 昌 然 ISO9660 文 件 结构 刻录 的 CD-R 光 盘 人 允许 用 户 在 多 种 操 
作 系 统 下 进行 访问 ,但 是 却 无 法 追加 刻录 新 的 数据 。 另 外 ， 昌 然 借 助 于 各 种 扩展 驱动 程序 ， 可 以 实现 |SO9660 与 各 操作 系统 之 间 的 信息 转换 ， 但 是 操作 系统 无 
法 识别 CD-R 和 CD-RW 刻 录 机 ， 需 要 使 用 各 种 各 样 的 刻录 软件 才 可 以 实现 利用 CD-R 或 CD-RW 刻 录 机 进行 读 写 操作 。 为 此 1996 年 OSTA (光学 存储 技术 协会 ) 
制定 了 7UDF 文 件 格式 ， 采 用 包 刻 录 (Packet Writing) 技术 ,将 CD-R 和 CD-RW 盘 当 作 硬盘 使 用 ， 人 允许 用 户 在 光盘 上 修改 和 删除 文件 。 


3.Rock Ridge 


和 蛤 于 |SO9660 格 式 只 支持 不 超过 8 个 字符 文件 名 、 不 超过 3 个 字符 扩展 名 以 及 8 层 文件 目 录 深 度 的 限制 ， 专 门 制定 了 Rock Ridge 文 件 格 式 ， 通 过 对 I1SO9660 
进行 延伸 ， 制 定 出 使 CD-ROM 能 兼容 UNIX 的 文件 系统 ， 支 持 文 件 名 字母 大 小 写 、 符 号 字符 、 长 文件 名 以 及 超过 8 层 的 目录 结构 。 


4.Joliet 


微软 公司 将 ISO9660 标 准 进行 扩展 ， 制 定 了 Joliet 文 件 系统 ， 可 以 支持 64 个 字符 的 长 文件 名 和 中 文 文件 名 ， 同 时 也 记录 相应 的 DOS 文 件 名 (“8+3” 格 
式 ) ， 以 便于 被 DOS 或 低 版 本 的 Windows 操 作 系 统 读 取 。 


2.5 ”其 他 文件 系统 


除了 前 面 介绍 的 FAT、EXT、NTFS 和 CDFS 等 常用 文件 系统 外 ，exFAT、YAFFS 等 适用 于 闪存 的 文件 系统 将 在 后 续 章 节 介绍 ， 此 外 还 有 一 些 其 他 不 太 常 用 
的 文件 系统 ， 在 这 里 进行 简单 介绍 。 


2.5.1 BtrFS 


BtrFS (通常 念 成 Butter FS、Better FS 或 B-tree FS) 是 一 种 支持 写 入 时 复制 (copy-on-write，COW) 的 文件 系统 ， 运 行 在 Linux 操 作 系 统 上 ， 采 用 GPL 
授权 。Oracle 于 2007 年 对 外 宣布 这 项 计划 并 发 布 源 代 码 ，2014 年 8 月 发 布 稳定 版 ， 目 标 是 取代 Linux 当 时 主流 的 EXT3 文 件 系统 ， 摆 脱 EXT3 的 一 些 限 制 ， 特 别 是 
单 文件 大 小 、 文 件 系 统 总 大 小 和 文件 校 验 ， 并 加 入 EXT3 不 支持 的 一 些 功能 ， 比 如 可 写 快 照 (writable snapshots) 、 快 照 的 快照 (snapshots of 
snapshots) 、 内 建 磁盘 阵列 (RAID) ， 以 及 子 卷 (subvolumes) 。 其 具体 特性 如 下 。 


. 扩展 性 (scalability) 相关 的 特性 


BtrFS 最 重要 的 设计 目标 是 应 对 大 型 机 器 对 文件 系统 的 扩展 性 要 求 。 盘 区 、 多 路 搜索 树 (B 树 ) 和 动态 节点 创建 等 特性 保证 了 BtrFS 在 大 型 机 器 上 仍 有 卓越 
的 表现 ， 其 整体 性 能 不 会 随 着 系统 容量 的 增加 而 降低 。 


“ 数据 一 致 性 (data integtity) 相关 的 特性 


当 系 统 面临 不 可 预料 的 硬件 故障 时 ，BtrFS 采 用 COW 事 务 技术 来 保证 文件 系统 的 一 致 性 。BtrFS 还 支持 checksum， 避 免 了 silent corrupt 的 出 现 。 而 传统 
文件 系统 则 无 法 做 到 这 一 点 。 


. 多 设备 管理 相关 的 特性 
BtrFS 支 持 创 建 快 照 (snapshot) 和 克隆 (clone) ， 并 且 能 够 方便 地 管理 多 个 物理 设备 ， 使 得 传统 的 卷 管理 软件 变 得 多 余 。 
. 其 他 难以 归 类 的 特性 


这 些 特性 都 是 比较 先进 的 技术 ， 能 够 显著 提高 文件 系统 的 时 间 / 空 间 性 能 ,包括 延迟 分 配 、 小 文件 的 存储 优化 、 目 录 索 引 等 。 
2.5.2 ZFS 


ZFS 的 命名 来 源 于 “Zettabyte File System” 的 首 字母 缩写 ， 本 身 并 不 具备 任何 的 缩写 含义 ， 只 是 作者 想 曾 述 一 个 具备 高 扩充 容量 文件 系统 且 支 持 许多 延 
伸 功 能 的 一 个 产品 ， 也 叫 动态 文件 系统 (Dynamic File System) ， 是 第 一 个 128 位 文件 系统 。 最 初 是 由 Sun 公 司 为 Solaris10 操 作 系 统 开发 的 文件 系统 。 作 为 
OpenSolaris 开 源 计划 的 一 部 分 ，ZFS 于 2005 年 11 月 发 布 ， 被 SUn 公 司 称 为 终极 文件 系统 ， 经 历 了 10 年 的 活跃 开发 ;而 最 新 的 开 友 将 全 面 开 放 ， 并 重新 命名 为 
OpenZFS。ZFS 具 有 如 下 特点 。 


` 基于 存储 池 


ZFS 是 基于 存储 池 的 ， 与 典型 的 映射 物理 存储 设备 的 传统 文件 系统 不 同 ， 所 有 在 存储 池 中 的 文件 系统 都 可 以 使 用 存储 池 的 资源 。 不 同 于 传统 文件 系统 需要 
驻 留 于 单独 设备 或 者 需要 一 个 卷 管理 系统 来 管理 使 用 一 个 以 上 的 设备 ，ZFS 创 建 在 虚拟 的 被 称 为 “zpool” 的 存储 池 之 上 (存储 池 最 早 在 AdvFS 中 实现 ， 并 且 
加 入 后 来 的 BtrFS) 。 每 个 存储 池 由 若干 虚拟 设备 组 成 。 这 些 虚拟 设备 可 以 是 原始 磁盘 ， 也 可 能 是 一 个 RAID1 镜 像 设备 ， 或 是 非 标准 RAID 等 级 的 多 磁盘 组 。 于 
是 zpool 上 的 文件 系统 可 以 使 用 这 些 虚 拟 设备 的 总 存储 容量 ， 可 以 使 用 磁盘 限额 以 及 设置 磁盘 预 留 空间 来 限制 存储 池 中 单个 文件 系统 所 占用 的 空间 . 


` 写 入 时 复制 事务 模型 


ZFS 使 用 一 种 写 入 时 复制 (COW) 事务 模型 技术 。 所 有 文件 系统 中 的 块 指针 都 包括 256 位 的 能 在 读 时 被 重新 校 验 的 关于 目标 块 的 校 验 和 。 含 有 活动 数据 的 
块 从 来 不 被 覆盖 ， 而 是 分 配 一 个 新 块 ， 并 把 修改 过 的 数据 写 在 新 块 上 。 所 有 与 该 块 相关 的 元 数据 块 都 被 重新 读 、 分 配 和 重 写 。 为 了 减少 该 过 程 的 开销 ， 多 次 读 
写 更 新 被 归纳 为 一 个 事件 组 ， 并 且 在 必要 的 时 候 使 用 日 志 来 同步 写 操作 。 

利用 写 时 拷贝 使 ZFs 的 快照 和 事务 功能 的 实现 变 得 更 简单 和 上 自然， 快照 功能 更 灵活 。 缺 点 是 COW 使 碎片 化 问题 更 加 严重 ， 对 于 由 顺序 写生 成 的 大 文件 ， 如 
果 以 后 随机 地 对 其 中 的 一 部 分 进行 了 更 改 ， 那 么 这 个 文件 在 硬盘 上 的 物理 地 址 就 变 得 不 再 连续 ， 未 来 的 顺序 读 会 变 得 性 能 比较 差 。 


:快照 与 克隆 


ZFs 使 用 写 入 时 复制 技术 的 一 个 优势 在 于 ， 写 新 数据 时 ， 包 含 旧 数据 的 块 被 保留 着 ， 提 供 了 一 个 可 以 被 保留 的 文件 系统 的 快照 版 本 。 由 于 ZFs 在 读 写 操作 
中 已 经 存储 了 所 有 构建 快照 的 数据 ， 所 以 快照 的 创建 非常 快 。 而 且 由 于 任何 文件 的 修改 都 是 在 文件 系统 和 它 的 快照 之 间 共 享 的 ， 所 以 ZFS 的 快照 也 是 空间 优化 
的 。 


可 写 快照 (“克隆”) 也 可 以 被 创建 ， 结 果 就 是 两 个 独立 的 文件 系统 共享 一 些 块 。 当 任何 一 个 克隆 版 本 的 文件 系统 被 改变 时 ， 新 的 数据 块 为 了 反映 这 些 改 
变 而 创建 ， 但 是 不 管 有 多 少 “ 克 隆 ” 版 本 的 存在 ， 未 改变 的 块 仍然 在 其 他 “克隆 ”版 本 中 共享 。 


- 动态 条 带 化 


ZFS 能 动态 条 带 化 所 有 设备 以 最 大 化 吞吐 量 。 当 额外 的 设备 被 加 入 到 zpool 中 的 时 1 
都 能 被 用 到 ， 同 时 负载 被 平 挫 到 所 有 的 磁盘 上 。 


吴 ， 条 带宽 度 会 自动 扩展 以 包含 这 些 设备 。 这 使 得 存储 池 中 的 所 有 磁盘 


.可 变 块 尺寸 


ZFS 使 用 可 变 大 小 的 块 ， 最 大 可 至 128KB。 现 有 的 代码 允许 管理 员 调 整 最 大 块 大 小 ， 这 在 大 块 效 果 不 好 的 时 候 有 用 。 未 来 也 许 能 做 到 自动 调整 适合 工作 量 
的 块 大 小 。ZFS 的 可 变 大 小 的 块 与 BtrFS 和 EXT4 的 Extent 不 同 。 在 ZFS 中 ， 在 一 个 文件 中 所 有 数据 块 的 逻辑 长 度 必 须 是 相同 的 ， 不 同文 件 之 间 的 块 大 小 可 以 不 
同 ， 因 此 ZFS 可 以 用 直接 映射 (direct map) 的 方式 ( 同 UFS/FFS/EXT2/EXT3) 来 搜索 间接 块 的 数据 措 针 数组 (blkptr) 。BtrFS 和 EXT4 的 Extent 方 式 在 同一 
个 文件 中 每 个 数据 块 的 大 小 都 可 以 不 相同 ， 因 此 需要 用 B+ 树 或 者 类 B 树 的 方式 来 组 织 间接 块 的 数据 。 


虽然 直接 映射 方式 比 B+ 树 的 查找 速度 快 ， 但 是 这 种 方式 的 缺点 也 非常 明显 ， 如 元 数据 开销 过 大 、 顺 序 1O 的 大 文件 性 能 不 好 、 删 除 比较 慢 等 ， 因 此 在 现代 
文件 系统 中 映射 方式 逐渐 被 Extent 变 长 块 取代 。 如 果 数 据 压缩 (LZJB) 被 启用 ， 可 变 块 大 小 需要 被 用 到 。 如 果 一 个 数据 块 可 被 压缩 至 一 个 更 小 的 数据 块 ， 则 小 
的 数据 块 将 使 用 更 少 的 存储 和 提高 吞吐 量 (代价 是 增加 CPU 压 缩 和 解压 缩 的 负担 ) 。 


2.5.3 HFS 


分 层 文件 系统 (Hierarchical File System，HFS) 是 由 苹果 公司 开发 ， 并 使 用 在 Mac OS 上 的 一 种 文件 系统 。 最 初 被 设计 用 于 软盘 和 硬盘 ， 同 时 也 可 以 在 
只 读 媒 介 如 CD-ROM 上 见 到 。HFS 首 次 出 现在 1985 年 9 月 17 日 ， 作 为 Macintosh 电 脑 上 新 的 文件 系统 。 它 取代 只 用 于 早期 Mac 型 号 所 使 用 的 平面 文件 系统 
Macintosh File System (MFS) 。 因 为 Macintosh 电 脑 所 产生 的 数据 比 其 他 通常 的 文件 系统 ， 如 DOS 使 用 的 FAT 或 原始 UNIX 文 件 系统 所 允许 存储 的 数据 更 
多 ， 苹 果 公 司 开发 了 一 种 新 式 更 适用 的 文件 系统 ， 而 不 是 采用 现 有 的 规格 。 例 如 ，HFS 人 允许 文件 名 最 多 有 31 个 字符 的 长 度 ， 支 持 metadata 和 双 分 支 (每 个 文 
件 的 数据 和 资源 分 开 存 储 ) 文件 。 尽 管 HFS 像 其 他 大 多 数 文件 系统 一 样 被 视 为 专 有 的 格式 ,但 是 只 有 它 为 大 多 数 最 新 的 操作 系统 提供 了 很 好 的 通用 解决 方法 以 
访问 HFS 格 式 磁 盘 。 


在 1998 年 ， 苹 果 公 司 发 布 了 HFS Plus (HFS+) ， 其 改善 了 HFS 对 磁盘 空间 地 址 的 定位 效率 ， 并 加 入 其 他 改进 。 当 前 版 本 的 Mac OS 仍旧 支持 HFS,， 但 从 
Mac OS X 开 始 HFS 卷 不 能 作为 启动 使 用 。 


分 层 文 件 系统 把 一 个 卷 分 为 许多 个 512 字 节 的 “逻辑 块 ”。 这 些 逻 辑 块 被 编组 为 “分 配 块 ”， 这 些 分 配 块 可 以 根据 卷 的 尺寸 包含 一 个 或 多 个 逻辑 块 。HFs 
对 地 址 分 配 块 使 用 16 位 数值 ， 分 配 块 的 最 高 限制 数量 是 65536。 


组 成 一 个 HFS 卷 需要 以 下 5 个 结构 : 


1) 卷 的 逻辑 块 O 和 1 是 局 动 块 ， 它 包含 了 系统 局 动 信息 。 例 如 ， 局 动 时 载 入 的 系统 名 称 和 壳 (通常 是 Finder) 文件 。 


2) 逻辑 块 2 包含 主 目录 块 (Master Directory Block， 人 简称 MDB) 。 
3) 逻辑 块 3 是 卷 位 图 (Volume Bitmap) 的 局 动 块 ， 它 仍 踩 分配 块 使 用 状态 。 
4) 总 目录 文件 (Catalog File) 是 一 个 包含 所 有 文件 的 记录 和 存储 在 卷 中 目录 的 B* 树 。 


5) 扩展 溢出 文件 (Extent Overflow File) 是 当 最 初 总 目录 文件 中 三 个 扩展 被 占用 后 ， 另 外 一 个 包含 额外 扩展 记录 的 分 配 块 对 应 信息 的 B* 树 。 


2.5.4 HFS+ 


HFS+ 文 件 系统 是 目前 苹果 电脑 中 默认 的 最 常见 文件 系统 ， 其 改善 了 HFS 对 磁盘 空间 的 地 址 定位 效率 低下 间 题 ， 并 加 入 了 其 他 改进 。HFS+ 来 源 于 UNIX， 
但 是 又 不 用 于 UNIX， 它 增加 了 许多 新 的 特性 ， 同 时 也 有 许多 不 同 于 Windows、UNIX 等 系统 的 概念 。HFS+ 是 苹果 公司 为 替代 他 们 的 分 层 文 件 系统 (HFS) 而 
开 友 的 一 种 文件 系统 。 它 被 用 在 Macintosh 电 脑 (或 者 其 他 运行 Mac OS 的 电脑 ) 上 。 它 也 是 iPod 上 使 用 的 一 种 格式 。HFS+ 也 被 称 为 Mac OS Extended (或 
误 称 为 “HFS Extended”) 。 在 开发 过 程 中 ， 苹 果 公 司 也 把 这 个 文件 系统 的 代号 命名 为 “Sequoia”。 


HFS+ 是 HFS 的 一 个 改进 版 本 ， 支 持 更 大 的 文件 ， 并 用 Unicode 来 命名 文件 或 文件 夹 ， 代 蔡 了 Mac OS Roman 或 其 他 一 些 字符 集 。 与 HFS 一 样 ，HFS+ 也 
使 用 B 树 来 存储 大 部 分 分 卷 元 数据 。 


HFs+ 文 件 系统 主要 由 卷 头 、 位 图 文件 、 扩 展 文 件 、 目 录 文 件 、 属 性 文件 、 局 动 文 件 、 日 志文 件 等 组 成 。 这 些 文件 的 作用 如 下 : 
1) 卷 头 。 记 录 构 建 HFS+ 文 件 系 统 的 基本 信息 ， 包 括 块 大 小 、 日 志 位 置信 息 以 及 一 些 重要 的 元 文件 的 位 置信 息 。 

2) 位 图 文件 。 用 于 标记 卷 中 哪些 块 已 经 被 使 用 ， 哪 些 块 为 空 内 。 

3) 扩展 文件 。 主 要 用 于 描述 碎片 太 多 的 文件 数据 范围 ， 文 件 碎片 的 前 8 个 碎片 存储 在 目录 文件 中 。 


4) 目录 文件 。 存 储 文件 的 元 信息 ， 这 些 信息 包括 文件 和 名、 文件 和 目录 之 间 的 层次 结构 、 文 件 创建 时 间 、 文 件数 据 碎片 的 前 8 个 碎片 区 域 等 。 文 件 与 目录 之 
间 的 层次 结构 由 文件 系统 分 配给 每 个 文件 和 目录 的 CNID 来 维护 。 


5) 属性 文件 。 存 储 附加 信息 。 
6) 启动 文件 。 用 于 从 HFS+ 卷 上 启动 非 Mac OS 系统 。 
7) 日 志文 件 。 用 于 解决 写 操作 异常 等 问题 ， 存 储 最 近 改 动 的 数据 信息 、。 


位 图 文件 、 扩 展 文 件 、 目 录 文 件 、 属 性 文件 均 采 用 B 树 进行 数据 管理 ， 文 件 的 元 信息 存储 在 B 树 的 叶子 节点 中 。 


2.5.5 ReilserFS 


Linux 内 核 从 2.4.1 版 本 开始 支持 ReiserFS 格 式 。ReiserFS 的 第 一 次 公开 亮相 是 在 1997 年 7 月 23 日 。 它 的 开 友 者 认为 ， 最 好 的 文件 系统 应 该 是 有 助 于 创建 独 
立 的 共享 环境 或 命名 空间 的 文件 系统 ， 应 用 程序 可 以 在 其 中 更 直接 、 有 效 和 有 力 地 相互 作用 。 为 了 实现 这 一 目标 ， 文 件 系统 束 应 该 满足 使 用 者 对 性 能 和 功能 
面 的 需要 。 使 用 者 能 够 直接 地 使 用 文件 系统 ， 而 不 必 建 造 运行 在 文件 系统 之 上 (如 数据 库 之 类 ) 的 特殊 目的 层 。 


为 此 ，ReiserFs 使 用 了 特殊 的 、 优 化 的 平衡 树 (每 个 文件 系统 一 个 ) 来 组 织 所 有 的 文件 系统 数据 ， 这 为 其 市 来 了 非常 不 错 的 性 能 改进 ， 也 能 够 减轻 文件 系 


统 设计 上 的 人 为 约束 。 另 一 个 使 用 平衡 树 的 好 处 束 是 ，ReiserFS 能 够 像 其 他 大 多 数 的 下 一 代 文 件 系 统一 样 ， 根 据 需 要 动态 地 分 配 泰 引 节 点 ， 而 不 必 在 文件 创建 
时 建立 固定 的 系 引 节点 。 这 有 助 于 文件 系统 更 灵活 地 适应 面临 的 各 种 人 存储 需要 ， 同 时 提高 附加 的 空间 效率 。 


ReiserFs 被 看 作 一 个 更 加 激进 和 现代 的 文件 系统 。 传 统 的 UNIX 文 件 系统 是 按 磁 盘 块 来 进行 空间 分 配 的 ， 对 于 目录 和 文件 等 使 用 了 简单 的 线性 查找 。 这 些 
设计 在 当时 是 合适 的 ， 但 随 着 磁盘 容量 的 增 大 和 应 用 需求 的 增加 ， 传 统 文 件 系统 在 存储 效率 、 速 度 和 功能 上 已 显得 落后 。 ReiserFS 的 更 新 版 本 Reiser4 提 供 了 
对 事务 的 支持 。 


ReiserFS 的 缺点 是 每 升级 一 个 版 本 都 要 将 磁盘 重新 格式 化 一 次 ， 而 且 它 的 安全 性 能 和 稳定 性 与 EXT3 相 比 有 一 定 的 差距 。 因 为 ReiserFS 还 不 能 正确 处 理 超 长 
的 文件 目录 ， 如 果 创 建 一 个 超过 768 字 符 的 文件 目录 ， 并 使 用 ls 或 其 他 echo 命 令 ， 将 有 可 能 导致 系统 挂 起 。 


2.5.6 JFS 


JFS (Journal File System) 是 一 种 字 节 级 日 志文 件 系统 。 该 文件 系统 主要 是 为 满足 服务 器 (从 单 处 理 器 系统 到 高 级 多 处 理 器 和 群集 系统 ) 的 高 吞吐 量 和 
可 靠 性 需求 而 设计 开发 的 。 在 IBM 的 AIX 系 统 上 ，JFS 已 经 过 较 长 时 间 的 测试 ， 结 果 表明 它 是 可 靠 、 快 速 和 容易 使 用 的 。 


与 非 日 志文 件 系统 相 比 ，JFS 的 突出 优点 是 快速 重启 能 力 ，JFS 能 够 在 几 秒 或 几 分 钟 内 束 把 文件 系统 恢复 到 一 臻 状态。 虽然 JFS 主 要 是 为 满足 服务 器 的 高 吞 
吐 量 和 可 靠 性 需求 而 设计 的 ,但 也 可 以 用 于 想得到 高 性 能 和 可 靠 性 的 客户 机 配置 ， 因 为 在 系统 衣 演 时 ，JFS 能 提供 快速 文件 系统 重 局 的 时 间 ， 所 以 它 是 因特网 
文件 服务 器 的 关键 技 术 。 


JFS 的 缺点 是 使 用 JFS 在 性 能 上 会 有 一 定 损失 ， 系 统 资 源 占用 的 比率 也 偏 高 ， 因 为 当 它 保存 一 个 日 志 时 ， 系 统 需 要 写 许 多 数据 。 


一 个 日 志文 件 系统 是 文件 和 目录 的 层 结 构 ， 即 文件 树 。 这 种 结构 类 型 与 倒置 的 树 ， 即 根 在 顶端 、 校 叶 在 低 端 相 类 似 ， 梳 代表 目录 ， 叶 代表 文件 。 这 种 文件 
树 使 用 目录 组 织 数据 而 且 设 计 成 组 ， 人 允许 一 次 管理 多 个 目录 和 文件 ， 在 一 个 JFs 中 能 保存 各 种 数据 。 


目录 在 内 核 里 是 基本 数据 ， 而 在 文件 系统 里 与 基本 文件 所 处 的 地 位 完全 一 样 。 目 录 可 以 像 普通 文件 一 样 被 读 出 ， 但 是 不 能 像 普 通 文件 那样 生成 和 写 入 。 目 
录 文 件 的 格式 是 由 二 进 制 数 和 正文 数据 组 合 而 成 的 ， 一 个 目录 项 由 16 字 节 组 成 ， 最 后 的 14 字 节 保 存 文件 名 。 当 文件 名 不 足 14 个 字符 时 用 AsCll 码 NULL (全 和 零 
值 ) 填 满 ， 而 开始 两 字 节 表示 文件 管理 信息 的 地 址 。 每 个 目录 文件 均 以 “.” 或 “http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/16547/OEBPS/Text/..” 开 始 ，“.” 是 进入 本 目录 的 目录 入 
口 ，“http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16547/OEBPS/Text/..” 代 表 当 前 目录 的 双 
杀 目 录 ， 也 右 是 靠近 此 目录 的 上 一 层 目录 。 


文件 是 一 个 字 节 序列 。 对 JFS 来 说 ， 文 件 没 有 记录 、 类 型 的 概念 ， 文 件 系统 对 文件 的 管理 并 不 涉及 文件 内 部 的 数据 结构 ， 文 件 内 部 的 数据 结构 视 具体 程序 
而 定 。 正 文 文件 以 行为 单位 记录 信息 ， 每 行 以 换行 符 为 结束 标志 。JFS 中 没有 记录 、 记 录 忆 数 、 字 节 忆 数 等 信息 ， 而 是 根据 文件 是 否 还 有 符号 来 表示 文件 是 否 
结束 。 系 统 内 核 的 文件 系统 记录 每 个 文件 长 度 ， 根 据 文 件 长 度 ， 系 统 可 以 判断 文件 的 结束 与 否 。 确 定 文件 类 型 不 能 只 根据 文件 名 作出 判断 (虽然 文件 名 可 以 有 
类 型 区 别 ) ， 命 名 的 方法 仪 仅 是 一 个 惯例 ， 并 不 能 完全 代表 文件 类 型 。 有 时 文件 的 标签 是 很 明确 的 ， 可 执行 程序 可 以 通过 在 文件 开始 的 “二 进 制 幻 数 ” 来 识 
别 。 在 od 命 令 不 加 选择 项 时 ， 它 以 16 位 即 两 字 节 为 单位 打印 文件 八进制 表示 ， 便 可 看 到 文件 的 幻 数 。 


由 FS 空间 分 为 chuck (大 块 ) ， 称 作 分 配 组 ， 每 个 分 配 组 包含 inode 和 数据 块 。 允 许 inode 和 数据 块 被 分 散 到 文件 系统 中 ， 而 且 允 许 文 件 数据 分 配 在 离 它 的 
inode 很 近 的 位 置 。 当 文件 系统 增 大 时 ， 分 配 组 数 也 增多 ， 当 分 配 组 增加 时 ， 文 件 系统 包含 更 多 的 inode 和 数据 块 。 第 一 个 分 配 组 开始 于 文件 系统 的 开端 ， 而 
且 包 含 一 个 保留 区 ,被 一 个 4096x2 字 节 的 组 所 占用 ， 这 个 区 的 第 0 个 4096 字 节 (0x0000) 用 来 保存 LVCB (Logical Volume Control Block) ， 第 1 个 4096 字 
节 (0xl000) 占据 文件 系统 的 主 superblock; 第 31 个 4096 字 节 (0xlf000) 保存 次 superblock。 第 二 个 分 配 组 始 于 第 32 块 ， 而 且 占 用 连续 足够 的 块 保存 分 配 组 
的 inode。 


2.5.7 XFS 


XFS 是 硅谷 图 形 公司 (SGI) 于 20 世 纪 90 年 代 初 开 友 的 一 种 非常 优秀 的 日 志文 件 系 统 。XFS 推 出 后 被 业界 称 为 先进 的 、 最 具 可 升级 性 的 文件 系统 技术 。 它 
是 一 个 全 64 人 位、 快速、 稳固 的 日 志文 件 系统 ， 多 用 于 SGI 的 1RIX 操 作 系 统 。 作 为 一 个 64 位 文件 系统 ，XFS 可 以 支持 超大 数量 的 文件 (9000x1GB) ， 可 在 大 型 
2D 和 3D 数 据 方面 提供 显 闭 的 性 能 。XFS 有 能 力 预 测 其 他 文件 系统 的 薄弱 环节 ， 能 够 在 不 妨碍 性 能 的 情况 下 增强 可 靠 性 和 快速 的 事故 恢复 。 


XFS 可 为 Linux 和 开放 资源 社区 带 来 如 下 新 特性 。 
* 可 升级 性 


XFS 被 设计 成 可 升级 的 ， 以 面 对 大 多 数 的 存储 容量 和 I/O 存 储 需 求 ;， 可 处 理 大 型 文件 和 包含 巨 大 数量 文件 的 大 型 目录 ， 以 满足 21 世 纪 快 速 增长 的 磁盘 需 
求 。XFS 有 能 力 动 态 地 为 文件 分 配 床 引 空间 ， 使 系统 可 以 支持 大 量 文件 。 


. 优秀 的 1/ 〇 性 能 


典型 的 现代 服务 器 使 用 大 型 的 条 市 式 磁盘 阵列 。XFS 可 以 很 好 地 满足 I/O 请 求 的 大 小 和 并 友 I/O 请 求 的 数量 。XFS 可 作为 ROOT 文 件 系统 ， 并 被 LILO 支 持 ， 
也 可 以 在 NFS 服 务 器 上 使 用 ， 并 支持 软件 磁盘 阵列 (RAID) 和 人 逻辑 卷 管理 器 (Logical Volume Management，LVM) 。 在 单个 文件 系统 的 测试 中 ， 其 吞吐 
量 最 高 可 达 每 秒 7GB， 对 单个 文件 的 读 写 操作 其 吞吐 量 可 达 每 秒 4GB。 


因为 XFS 比较 复杂 ， 实 施 起 来 有 一 些 难度 (包括 人 员 培 训 等 ) ， 所 以 目前 XFS 主要 应 用 于 Linux 高 端 用 户 。 
2.5.8 UFS 


UFS 是 UNIX 文 件 系 统 的 简称 ， 它 来 源 于 4.3Tahoe 发 行 版 中 提供 的 BSD Fat Fast File System (FFS， 高 速 文件 系统 ) ， 属 于 FFS 的 演化 版 本 ， 是 Solaris 的 
默认 文件 系统 。UFS 几 平 是 大 部 分 UNIX 类 操作 系统 默认 的 基于 磁盘 的 文件 系统 ， 包 括 Solaris、Free BSD、Open BSD、Net BSD、HP-UX 等 ， 甚 至 苹果 公司 
的 OS X 也 能 支持 UFS。 


在 最 初 的 FFS 设 计 中 ， 为 了 使 文件 系统 在 遭 到 毁 炎 性 打击 ， 如 硬盘 发 生 整 个 磁道 、 整 个 盘面 或 者 整个 柱 面 损坏 时 能 够 得 以 恢复 ， 在 文件 系统 初始 化 时 ， 会 
将 文件 系统 的 重要 数据 结构 复制 到 整个 磁盘 的 多 个 位 置 ， 以 便 在 发 生硬 件 损坏 时 能 够 读 取 ， 而 UFS 也 继承 了 这 些 优 民 的 特性 。 另 外 ， 为 了 提高 运行 效率 ，UF9 


与 磁盘 的 结构 也 有 着 完美 的 结合 ，UF s 将 整个 磁盘 的 所 有 逻辑 柱 面 平 均 分 配 为 奋 干 个 组 ， 每 组 称 为 一 个 “ 柱 面 ”。 在 UFS 内 部 融 用 柱 面 组 对 文件 系统 进行 分 段 
组 织 和 管理 ， 每 个 柱 面 组 中 都 有 文件 系统 天 键 数据 结构 的 备份 ， 所 有 文件 在 各 个 柱 面 组 中 相对 独立 地 存储 而 又 有 机 地 结合 在 一 起 。 这 融 使 磁盘 中 的 磁头 在 访问 
文件 系统 中 的 数据 时 有 效 地 减 小 了 摆动 ， 提 高 了 访问 效率 。 


在 创建 UFs 时 ， 磁 盘 的 盘 片 祝 分 成 耕 干 个 柱 面 组 ， 每 个 柱 面 组 由 一 个 或 多 个 联系 的 磁盘 柱 面 组 成 ， 在 文件 系统 的 前 部 会 有 一 个 叫 作 “ 柱 面 组 概要 ”的 结构 
对 整个 文件 系统 中 的 每 个 柱 面 组 信息 进行 统计 ， 并 且 在 每 个 柱 面 组 中 还 有 一 个 “ 柱 面 组 描述 待 ” 用 来 管理 当前 柱 面 组 。 每 个 柱 面 组 又 进一步 被 分 成 若干 个 可 寻 
址 的 块 ， 以 控制 和 组 织 柱 面 组 中 文件 的 结构 ， 所 以 “ 块 ”是 UFS 中 文件 分 配 和 存储 的 基本 单位 ， 类 似 于 FAT 文 件 系 统 和 NTFS 中 “ 艇 ”的 概念 。 


在 UFS 中 ，“ 块 ”有 多 种 类 型 ， 每 种 类 型 的 块 都 具有 特定 的 功能 。UFS 主 要 具有 四 种 类 型 的 块 : 引导 块 、 超 级 块 、i 和 节点、 数据 块 。 其 中 ， 引 导 块 为 在 引导 
系统 时 使 用 的 信息 ; 超级 块 记录 文件 系统 的 详细 信息 ;i 节点 记录 文件 的 各 种 信息 ; 数据 块 存储 每 个 文件 的 实际 内 容 。 


UFs 中 的 “ 块 ” 又 被 分 成 更 小 的 单位 ， 叫 作 “ 段 ”。 在 创建 UFs 时 ， 可 定义 段 的 大 小 ， 默 认 的 段 大 小 一 般 为 1KB。 每 个 块 都 可 以 分 成 各 干 个 段 ， 段 大 小 的 
上 限 束 是 块 的 大 小 ， 下 限 实 际 上 为 磁盘 房 区 大 小 ， 通 常 为 512 字 节 ，。 


当 文 件 写 入 文件 系统 时 ， 首 先 为 文件 分 配 完 整 的 块 ， 然 后 为 不 满 一 个 块 的 剩余 部 分 分 配 有 录 个 块 的 一 个 或 者 多 个 段 。 对 于 比较 小 的 文件 ， 首 先 分 配 段 进行 存 
储 ; 能 够 为 文件 分 配 块 中 的 段 而 不 是 仅 分 配 完整 的 块 ， 减 少 了 块 中 未 使 用 的 空间 ， 从 而 提高 了 磁盘 的 利用 率 。 在 创建 文件 系统 时 ， 选 择 段 的 大 小 需要 考虑 时 间 
和 空间 的 平衡 ， 小 的 段 大 小 可 节省 空间 ， 但 是 需要 更 多 的 时 间 进 行 分 配 ， 通 常 ， 当 大 多 数 文件 都 很 大 时 ， 为 了 提高 存储 效率 ， 应 为 文件 系统 使 用 较 大 的 段 ;， 当 
大 多 数 文 件 都 比较 小 时 ， 应 为 文件 系统 使 用 较 小 的 段 。 


续 上 所 述 ，UFS 由 若干 个 “ 柱 面 组 ”构成 ， 每 个 柱 面 组 包含 一 定数 量 的 “ 块 ”， 每 个 块 又 由 若干 个 “ 段 ”组 成 。“ 段 ”是 UFS 的 最 小 存储 单元 。 每 个 柱 面 
组 、 块 、 段 在 文件 系统 中 都 有 自身 的 编号 ， 它 们 的 起 始 编 号 都 是 0。 


另外 ， 超 级 块 是 UFS 中 非常 重要 的 一 个 结构 ， 其 重要 性 类 似 于 FAT 文 件 系 统 和 NTFS 中 的 DBR， 所 以 UFS 在 每 个 柱 面 组 中 都 对 超级 块 做 了 备份 ， 但 备份 的 位 
置 却 各 不 相同 ， 在 每 个 柱 面 组 中 都 会 友 生 一 定 的 偏转 ， 这 是 因为 在 原来 的 硬盘 中 每 个 磁道 具有 相同 的 扇 区 数 ， 这 个 就 导致 每 个 柱 面 组 的 第 一 个 扇 区 都 位 于 同一 
个 盘面 上 。 为 了 减 小 因 故 障 而 产生 的 数据 损坏 ， 将 超级 块 的 备份 在 每 个 柱 面 组 中 错位 存放 就 可 以 使 它们 不 再 存储 于 同一 个 盘面 ， 从 而 降低 了 风险 。 而 现在 的 新 
式 硬盘 中 每 个 柱 面 的 扇 区 数 并 不 相等 ， 所 以 也 束 不 存在 这 样 的 隐患 ， 实 际 上 UFS2 已 经 不 再 考虑 数据 错位 存放 的 问题 。 


2.5.9 VMFS 


VMware Virtual Machine File System (VMFS) 是 一 种 高 性 能 的 群集 文件 系统 ， 它 使 虚拟 化 技术 的 应 用 超出 了 单个 系统 的 限制 。VMFS 的 设计 、 构 建 和 
优化 针对 虚拟 服务 器 环境 ， 可 让 多 个 虚拟 机 共同 访问 一 个 整合 的 群集 式 存储 池 ， 从 而 显著 提高 了 资源 利用 率 。 


VMFS 有 一 个 本 质 的 区 别 束 是 在 VMFS 中 没有 某 人 台 服 务 器 或 某 个 软件 可 以 完全 控制 对 文件 系统 的 访问 权限 。VMFS 通 过 运行 于 每 一 人 台 主 机 上 ， 直 接管 理 文 
件 系统 的 命名 空间 来 达到 | 协调 管理 客户 端 对 文件 的 访问 权限 。 每 个 VMFS 卷 都 在 文件 系统 中 保留 了 一 定 的 空 几 区域 用 于 内 部 协调 时 使 用 。 确 保 VMFS 适 用 于 虚 
拟 环 境 的 技术 特性 包括 : 具有 分 层 目录 结构 的 自动 文件 系统 、 针 对 群集 环境 中 的 虚拟 机 进行 优化 、 锁 定 管理 和 分 布 式 逻辑 考 管 理 、 跨 越 多 个 存储 盘 区 与 动态 扩 
展 数 据 存 储 区 、 具 有 日 志 记 录 的 群集 式 文件 系统 可 迅速 恢复 、 将 整个 虚拟 机 状态 封 潜在 单个 目录 中 。 


作为 虚拟 机 (VM) 环境 的 智能 化 和 自动 化 存储 接口 ，VMFS 提 供 了 自动 的 群集 文件 系统 功能 和 智能 的 群集 卷 管理 功能 。VMFS 所 具有 的 大 量 优点 使 其 特 
别 适合 作为 虚拟 环境 中 的 群集 文件 系统 ， 如 支持 可 确保 应 用 程序 服务 级 别 的 独特 功能 、 无 颖 管理 虚拟 机 存储 、 简 化 灾难 恢复 等 。 


VMFS 是 跨越 多 个 服务 器 实现 虚拟 化 的 基础 ， 传 统 文件 系统 在 给 定时 间 内 只 允许 一 台 服 务 器 读 写 同 一 文件 ， 而 VMFS 是 一 种 集群 文件 系统 ， 它 利用 共享 存 
储 允 许多 个 VMware ESX (Elastic Sky X) 实例 同时 读 写 相同 存储 位 置 。 它 可 启用 VMware VmotionTM、Distributed Resource Scheduler 和 VMware 
High Availability 等 各 种 服务 。VMFS 还 能 显著 减少 管理 开销 ， 它 提供 了 一 种 高 效 的 虚拟 化 管理 层 ， 特 别 适 合 大 型 企业 数据 中 心 。 


采用 VMFS 可 实现 资源 共享 ， 使 管理 员 轻 松 地 从 更 高 效率 和 存储 利用 率 中 直接 获 益 。 作 为 一 个 群集 文件 系统 ，VMFS 人 允许 多 个 ESX/ESXi 服 务 器 同时 访问 同 
一 个 VMFS 数 据 存储 (VMware ESX 和 VMware ESXi 是 “ 裸 机 ”管理 程序 ， 它 们 直接 安 潜在 物理 服务 器 之 上 ， 并 将 其 划分 成 可 同时 运行 的 多 个 虚拟 机 ， 这 些 虚 
拟 机 共享 底层 服务 器 的 物理 资源 。 每 个 虚拟 机 都 代表 着 一 个 完整 的 系统 ， 具 有 处 理 器 、 内 存 、 网 络 连 接 、 和 存储 并 且 可 运行 未 经 修改 的 操作 系统 和 应 用 程序 ) 。 


为 了 确保 多 台 服 务 器 不 会 同时 访问 同一 个 虚拟 机 ，VMFS 提 供 了 磁盘 锁定 。 为 了 协调 对 VMFS 内 部 文件 系统 信息 的 访问 ，ESX/ESXi 会 在 整个 逻辑 单元 设备 
上 使 用 小 型 计算 机 系统 接口 (Small Computer System Interface，SCSI) 。 图 2-16 显 示 了 共享 同一 个 VMFS 卷 的 若干 ESX/ESXi 系 统 。 


ESX 服 务 器 A ESX 服 务 器 B ESX 服 务 器 C 
Wi 





鹿 拟 磁盘 文件 
VMFS 卷 


图 2-16 ” 跨 ESX 服 务 器 共享 VMFS 数 据 存储 
2.5.10 VxFS 


Veritas File System (VxFS) 是 Veritas 公 司 推出 的 一 种 高 性 能 、 高 可 用 性 的 文件 系统 ， 一 般 用 于 数据 中 心 。 它 是 一 种 基于 扩展 的 文件 系统 ， 能 够 让 应 用 
程序 读 取 和 写 入 大 的 连续 块 ， 适 用 于 OLTP 系 统 和 和 DSS 系统。 


VxFs 是 首 个 商业 日 志 记 录 文 件 系 统 。 通 过 日 志 记 录 功 能 ， 元 数据 更 改 首先 写 入 日 志 ， 然 后 再 写 入 磁盘 。 由 于 无 须 在 多 处 写 入 更 改 ， 且 元 数据 是 异步 写 入 
的 ， 因 此 吞吐 量 较 快 。VxFSs 也 是 基于 扩展 区 的 意向 日 志 记录 文件 系统 。VxFSs 设 计 用 于 要 求 高 性 能 和 高 可 用 性 ， 并 且 可 以 处 理 大 量 数据 的 操作 环境 。 


VxFS 通 常 被 应 用 于 分 布 式 集群 、 双 机 、 异 地 容 灾 等 高 可 靠 解决 方案 中 ， 它 主要 是 与 VCS/AVVYR/GCO/VxV MM 这些 软 件 配 套 使 用 。 该 文件 系统 的 一 大 优势 是 
由 于 HA 的 主 、 备 节点 上 可 以 同时 在 线 看 到 相同 的 磁盘 组 (Diskgroup) ，VxFS 可 以 实现 自动 对 磁盘 组 加 锁 、 解 锁 ， 从 而 保证 存储 设备 只 在 主 节点 上 输入 输 
出 。VxFs 的 主要 组 件 包 括 日 志 记录 、 扩 展区 、 文 件 系统 磁盘 布局 。 


2.2.11 RefS 


ReFS (Resilient File System， 弹 性 文件 系统 ) 是 在 Windows Server2012 中 新 引入 的 一 个 文件 系统 。 目 前 只 能 应 用 于 存储 数据 ， 还 不 能 引导 系统 ， 并 且 
在 移动 媒介 上 也 无 法 使 用 。 


ReFS 是 与 NTFS 大 部 分 兼容 的 ， 其 主要 目的 是 为 了 保持 较 高 的 稳定 性 ， 可 以 自动 验证 数据 是 否 损坏 ， 并 尽力 恢复 数据 。 如 果 与 引入 的 Storage Spaces ( 存 
储 空间 ) 联合 使 用 的 话 则 可 以 提供 更 佳 的 数据 防护 。 同 时 对 于 上 亿 级 别 的 文件 处 理 也 有 性 能 上 的 提升 。 


ReFS 的 关键 功能 如 下 (其 中 某 些 功 能 与 存储 空间 联合 提供 ) : 

1) 市 有 校 验 和 的 元 数据 完整 性 。 

2) 提供 可 选用 户 数 据 完整 性 的 完整 性 流 。 

3) 通过 写 入 时 分 配 事务 模型 实现 可 靠 的 磁盘 更 新 (也 称 为 写 入 时 复制 ) 。 

4) 文 持 超大 规模 的 卷 、 文 件 和 目录 。 

5) 人 存储 池 和 虚拟 化 使 得 文件 系统 可 建立 并 易于 管理 。 

6) 通过 数据 条 市 化 提高 性 能 (市 宽 可 管理 ) 并 通过 备份 提高 容错 性 。 

7) 通过 磁盘 扫 摘 防止 潜在 的 磁盘 错误 。 

8) 借助 “数据 打捞 ”实现 损坏 还 原 ， 以 便 在 任何 情况 下 尽 可 能 提高 卷 的 可 用 性 。 


9) 跨 计算 机 共享 存储 池 ， 以 提供 额外 的 容错 性 和 负载 平衡 。 


此 外 ，ReFS 还 从 NTFS 集 成 了 某 些 功能 和 语义 ,包括 BitLocker 加 密 、 用 于 安全 的 访问 控制 列表 、USN 日 志 、 更 改 通知 、 符 号 链接 、 交 接点 、 装 入 点 、 重 
解析 点 、 卷 快照 、 文 件 ID 和 操作 锁 。 当 然 ， 客 户 端 只 要 使 用 任何 操作 系统 中 可 访问 现 有 NTFS 卷 的 文件 访问 AP1， 就 可 以 访问 以 ReFSs 存 储 的 数据 。 


2.6” 弟 用 文件 系统 的 对 比分 析 


在 通常 情况 下 ， 文 件 系统 属于 操作 系统 的 一 部 分 ， 前 面 对 几 种 常用 的 文件 系统 进行 了 介绍 ， 下 面 根据 操作 系统 对 文件 系统 进行 对 比分 析 。 
1.Windows 操 作 系 统 中 的 文件 系统 
Windows 操 作 系 统 所 可 以 直接 支持 的 文件 系统 有 FAT、NTFS、CDFS 和 UDF， 表 2-12 对 Windows 操 作 系 统 所 支持 的 主要 文件 系统 进行 了 总 结 。 


表 2-12 Windows 操 作 系 统 中 的 文件 系统 特点 对 比 


文件 系统 特 ” 扣 


1982 年 开始 应 用 于 MS-DOS 中 。 根 据 分 区 表 中 字 长 位 数 的 不 同 ， 分 为 FAT 12、FAT 16、FAT 32 
三 种 版 本 。 

FAT 12 的 特点 是 : 

1 ) 最 多 可 以 管理 8MB 的 磁盘 容量 

2 ) 文件 碎片 严重 

FAT 16 的 使 用 时 间 最 长 ， 其 特点 是 : 

1 ) 可 管理 的 磁盘 容量 从 32MB 、128MB ， 发 展 到 了 2GB 

2 ) 大 磁盘 利用 效率 低 

FAT 32 是 FAT 系列 的 最 后 一 个 文件 系统 ， 目 前 文 持 FAT 32 的 操作 系统 有 Windows 95/98/98SE/ 
Me/2000/XP/8/10 等 以 及 Linux Redhat 部 分 版 本 也 对 FAT 32 提供 有 限 支持 ， 然 而 ， 如 果 Linux 安 
装 在 FAT 32 分 区 下 ， 必 须 使 用 软盘 进行 引导 。FAT 32 具有 以 下 特点 : 

1 ) 在 兼容 性 方面 ，FAT 32 不 能 保持 向 下 兼容 

2 ) 当 分 区 小 于 512MB 时 ，FAT 32 不 会 发 生 作 用 

单个 文件 不 能 大 于 4GB (精确 数据 是 2B ~ 4GB )。 

NTFS 是 Windows NT 家 族 (如 Windows 2000/XP/Vista /7/8/10 等 ) 的 限制 级 专用 的 文件 系统 ( 操 
作 系 统 所 在 的 盘 符 的 文件 系统 必须 格式 化 为 NTFS)。 目 前 ，NTFS 已 逐渐 取代 了 FAT 文件 系统 。 
NTFS 的 特点 是 : 

1 ) 可 恢复 的 文件 系统 ， 通 过 使 用 标准 的 事务 处 理 日 志和 恢复 技术 来 保证 分 区 的 一 致 性 

2 ) 文 持 对 分 区 、 文 件 夹 和 文件 的 压缩 

更 好 的 安全 性 ， 可 为 共享 资源 、 文 件 夹 及 文件 设置 访问 许可 权限 


FAT 


NTFS 


文件 系统 特 点 


1988 年 为 只 读 光 盘 制定 的 文件 系统 ， 比 较 简 单 ， 但 具有 一 定 限制 
1 ) 文件 和 目录 名 长 度 必 须 小 于 32 个 字符 ; 
2 ) 目录 树 的 深度 不 能 超过 8 层 
3 ) 现 已 逐渐 被 UDF 文件 系统 所 取代 
1995 年 由 光学 存储 技术 学 会 为 光 磁 盘存 储 媒 介 (如 DVD-ROM) 所 制定 ， 用 来 取代 CDFS， 比 
CDFS 更 加 灵活 ，UDF 具有 以 下 特点 : 
UDF 1 ) 文件 名 区 分 大 小 写 
2 ) 文件 名 字符 长 度 可 以 有 255 个 字符 长 
3 ) 最 长 路 径 可 有 1023 个 字符 


CDFS 


2.Linux 操 作 系 统 中 的 文件 系统 


Linux 是 一 个 性 能 稳定 、 功 能 强大 、 效 率 高 的 操作 系统 。 它 在 功能 特性 方面 与 UNIX 系 统 相 似 ， 同 时 又 具有 多 任务 、 多 用 户 、 多 平台 等 若干 特性 。Linux 最 


早 的 文件 系统 是 Minix， 随 着 专门 为 Linux 设 计 的 文件 系统 EXT2 被 设计 出 来 并 添加 到 Linux 中 ， 这 对 Linux 产 生 了 重大 影响 ， 并 逐渐 发 展 到 目前 最 新 的 EXT4。 表 
2-13 对 Linux 操 作 系 统 所 支持 的 主要 文件 系统 进行 了 忆 结 。 


表 2-13 Linux 操 作 系 统 中 的 文件 系统 特点 对 比 


文件 系统 特 点 

Linux 最 早 引 入 的 文件 系统 ， 由 Minix 操作 系统 定义 ， 有 一 定 的 局 限 性 : 如 文件 名 最 长 14 个 字 
件 ， 文 件 最 长 64MB， 目录 只 能 存放 固定 数目 的 文件 

EXT 系列 经 过 了 EXT2、EXT3、EXT4 三 种 版 本 。 

EXT2 的 特点 是 : 

1 ) 采用 三 级 间接 块 来 存 取 数据 块 指针 ， 并 以 块 单位 分 配 空间 

2 ) 磁盘 分 配 策 略 是 尽 可 能 将 逻辑 相 邻 的 文件 分 配 到 磁盘 上 物理 相 邻 的 块 中 ， 并 将 碎片 分 配给 尽 
量 少 的 文件 ， 从 而 从 全 局 上 提高 性 能 

EXT3 是 对 EXT2 的 扩展 ， 兼 容 EXT2， 加 入 了 日 志 功 能 ， 日 志 式 文件 系统 的 最 大 特点 是 会 将 整 
个 磁盘 的 写 人 操作 完整 地 记录 在 磁盘 的 某 个 区 域 上 ， 以 便 回 溯 奶 踪 。EXT3 的 特点 是 : 

1 ) 高 可 用 性 及 数据 完整 性 

EXT 2 ) 系统 速度 快 ， 及 文 持 多 种 日 志 模 式 

EXT4 是 针对 EXT3 的 扩展 日 志 式 文件 系统 ，EXT4 修改 了 EXT3 中 部 分 重要 的 数据 结构 ， 而 不 
仅仅 像 EXT3 对 EXT2 那样 ， 只 是 增加 了 日 志 功 能 ，EXT4 可 提供 更 佳 的 性 能 和 可 靠 性 。EXT4 的 
主要 特点 是 : 

1 ) 支持 更 大 的 文件 系统 和 文件 (EXT3 只 支持 16TB 的 文件 系统 和 2TB 的 文件 ， 而 EXT4 可 支 
持 1EB 的 文件 系统 和 16TB 的 文件 ) 

2 ) 无 限 数量 的 子 目 录 (EXT3 只 支持 32000 个子 目录 ) 

3 ) 支持 多 块 分 配 、 延 迟 分 配 、 持 久 预 分 配 

4 ) 日 志 校 验 


Minix 
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第 3 草 ”接口 与 协议 


早期 的 计算 机 系统 中 并 没有 设置 独立 的 接口 部 件 ， 对 外 设 的 控制 与 管理 完全 由 CPU 直接 承担 。 这 在 当时 的 外 设 品种 少 、 操 作 简单 的 情况 下 是 可 行 的， 在 赃 
入 式 领域 流行 的 单片机 现在 仍然 保持 着 这 种 简单 而 集约 的 风格 。 然 而 ， 由 于 信息 技术 的 飞速 友 展 ， 计 算 机 的 应 用 越 来 越 广泛 ， 外 设 门 类 品种 大 大 增加 ， 且 性 能 
各 异 ， 操 作 复 杂 。 因 此 ， 不 设置 专用 接口 已 经 无 法 满足 工作 需要 。 因 为 ，CPU 要 向 外 设 友 送 控制 信和 号， 包括 设备 的 选 定 、 设 备 局 动 、 信 息 的 转换 、 数 据 的 装配 


与 拆卸 、 地 址 的 改变 ， 以 及 检测 和 判断 信息 是 否 结束 等 ， 这 些 操 作 都 由 CPU 按 程序 进行 ， 而 且 每 交换 一 次 信息 丈 需 要 按 上 述 过 程 循环 一 次 ， 直 到 所 交换 的 信息 
完成 乙 后 ，CPU 才 能 做 下 一 步 的 工作 ， 效 率 非 党 低 。 其 次 ， 由 于 外 设 种 类 繁多 ， 且 每 种 外 设 提供 的 信息 格式 、 电 平 高 低 、 逻辑 关系 各 不 相同 ， 因 此 主机 对 每 一 
种 外 设 都 要 配置 一 套 相应 的 控制 和 人 逻辑 电路 ， 使 得 主机 对 外 设 的 控制 电路 非常 复杂 ， 并 且 不 易 扩充 和 改变 ， 这 种 结构 极 大 地 阻碍 了 计算 机 的 发展 。 


为 了 解决 上 述 矛 盾 ， 人 们 开始 在 CPU 和 外 设 之 间 设 置 简单 的 接口 电路 ， 后 来 又 逐步 太 展 成 为 独立 的 接口 和 设备 控制 器 ， 把 对 外 设 的 控制 任务 交 给 接口 完 
成 ， 这 样 束 大 大 减轻 了 主机 的 负担 ,简化 了 CPU 对 外 设 的 控制 和 管理 。 同 时 ， 有 了 接口 之 后 ， 研 制 CPU 时 无 须 考虑 外 设 的 结构 和 特性 。 同 样 ， 研 制 外 设 时 也 不 
需要 考虑 它 是 同 哪 种 CPU 进 行 连接 。 这 样 ，CPU 与 外 设 按 各 自 的 规律 更 新 ， 促 进 了 计算 机 技术 的 快速 友 展 。 


本 章 主要 关注 存储 器 与 主机 之 间 的 接口 ， 即 主板 和 某 类 外 设 存 储 器 之 间 的 适 配 电 路 ， 其 功能 是 解决 主板 和 外 设 之 间 在 电压 等 级 、 信 号 形式 和 速度 上 的 匹配 
问题 ， 不 同类 型 的 存储 器 需要 不 同 的 接口 。 在 整个 系统 中 ， 存 储 器 接口 的 优 务 直接 影响 着 程序 运行 的 快慢 和 系统 性 能 的 好 坏 ， 而 协议 定义 了 通信 主体 间 的 通信 
规则 。 在 计算 机 系统 中 常用 的 存储 器 物理 协议 和 接口 包括 以 下 几 种 。 


1) IDE 协 议 及 接口 : 承载 ATA 协 议 。 面 向 消费 级 ， 属 于 并 行 忌 线 接口 ， 最 多 连接 两 个 设备 。 物 理 层 速 率 比 同时 代 的 SCSI 接 口 低 ， 其 定义 了 传输 层 到 物理 
层 。 


2) SCSI 协 议 及 接口 : 承载 SCSI 协 议 ， 属 于 并 行 总 线 接口 。 在 通常 的 理解 中 ，SCSI 是 一 种 上 层 协议 ; 但 SCSI 标 准 早期 把 上 层 协 议 一 直到 底层 传输 协议 、 网 
络 层 、 物 理 层 全 给 定义 了 。 


3) SATA 协 议 及 接口 : 承载 ATA 协 议 。 属 于 串 行 总 续 接 口 ， 每 个 通道 只 能 接 入 一 个 设备 ， 采 用 特殊 的 Mux 可 以 复 用 多 个 设备 。 其 定义 了 传输 层 到 物理 层 。 


4) PCI-E 协 议 及 接口 : 承载 PCI-E 传 输 协 议 ， 定 义 了 传输 层 到 物理 层 。 用 于 仓储 系统 时 ， 一 般 直接 承载 NVMe 协 议 ， 也 可 以 承载 SC9I 协 议 。 目 前 PCI-E 设 
备 侧 连 接 器 形态 主要 是 标准 插 权 或 者 SFF8639 (U.2) 。 


5) FC 协议 及 接口 : 理论 上 可 以 承载 任何 上 层 协 议 ， 用 于 存储 系统 时 则 承载 SCSI 协 议 。 分 为 FCAL 和 FC Fabric 两 种 网 络 层 拓扑 ， 磁 盘 接 入 的 是 FCAL 拓 扑 。 
为 了 满足 企业 级 对 可 用 性 的 要 求 ，FC 盘 被 作为 双 数 据 接口 ， 接 入 两 个 成 环 器 再 各 自 上 联 到 FC 控制 器 上 。 其 定义 了 传输 层 到 物理 层 。 


6) SAS 协 议 及 接口 : 承载 SCSI 协 议 ， 属 于 并 行 总 线 接口 。 目 前 速率 为 12Gbit/s， 支 持 交换 式 组 网 、 电 路 交换 ， 不 能 成 环 。 其 定义 了 传输 层 到 物理 层 。 
SAS 和 SATA 的 连接 器 看 上 去 差不多 ， 仔 细 观 察 会 友 现 SATA 连 接 器 中 间 的 缺口 在?AS 上 是 被 补 平 的 ， 其 反面 其 实 还 有 7 根 数据 线 ， 这 融 是 企业 级 见 余 所 要 求 的 双 
端口 ， 这 第 二 个 数据 口 接 入 到 第 二 个 SAs 控 制 器 或 者 扩展 器 (Expander) 上 。 


7) USB 协 议 及 接口 : 承载 USB 协 议 ， 属 于 串 行 总 线 接 口 ， 定 义 了 传输 层 到 物理 层 。 文 持 级 联 连接 ， 主 要 用 来 连接 计算 机 与 外 围 可 插 拔 装置 ， 其 即 插 即 用 
(Plug and Play) 的 功能 使 得 不 须 经 过 繁复 的 安 妆 程 序 便 可 任意 将 外 围 妆 置 进行 连接 、 配 置 、 使 用 及 移 除 。 由 于 UsB 的 弹性 与 容易 使 用 ， 使 得 广 持 USB 的 外 
围 妆 置 包括 鼠标 、 键 盘 、 喇 叭 、 调 制 解 调 器 、 扫 摘 仪 等 各 种 不 同 的 产品 逐年 增加 ， 时 全 今日 ，USB 接 口 已 成 为 目 COM port ( 串 行 端口 ) 以 后 ， 计 算 机 上 最 成 
功 的 外 围 连接 接口 。 


8) eMMC 协 议 及 接口 : 没有 连接 器 ， 直 接 从 Flash 颗 粒 管 脚 以 贴 片 的 方式 与 eM M(C 控 制 器 的 管 脚 相连 ， 承 载 eMMC 上 层 协 议 (与 ATA/SCSI/NVMe 处 于 
同一 个 阶层 ) 。 底 层 物理 层 采 用 并 行 总 线 。eM M(5 与 早期 SCSI 的 做 法 类 似 ， 从 顶层 协议 到 质 层 物理 层 全 都 定义 了 一 套 自 己 的 标准 。 其 定义 了 表示 层 到 物理 
层 。 


9) SDIO 协 议 及 接口 : SDIO 接 口 是 由 SD 存储 卡 的 接口 信号 一 一 SD 总 线 发 展 而 来 的 ， 它 在 机 械 、 电 路 、 功 耗 、 信 号 与 软件 上 与 SD 存储 卡 完 全 兼容 ,但 
SDIO 接 口 可 扩展 性 更 强 ， 传 输 速 度 更 快 。 


本 章 对 前 6 种 协议 和 接口 进行 介绍 ， 后 3 种 由 于 与 Flash 存 储 器 件 紧 密 相关 则 留 在 后 面 介 绍 。 


3.1 |IDE 


1DE 的 英文 全 称 为 “Integrated Drive Electronics” ， 即 电子 集成 驱动 器 ， 它 的 本 意 是 指 把 控制 电路 和 盘 片 、 磁 头等 放 在 一 个 容器 中 的 硬盘 驱动 器 。 把 盘 
体 与 控制 电路 放 在 一 起 的 做 法 减少 了 硬盘 接口 的 电缆 数目 与 长 度 ， 数 据 传输 的 可 靠 性 得 到 了 增强 。 而 且 硬 盘 制造 起 来 更 加 容易 ， 因 为 硬盘 生产 厂商 不 需要 再 担 
心 自己 的 硬盘 是 否 与 其 他 厂商 生产 的 控制 器 兼容 。 对 用 户 而 言 ， 硬 盘 安装 也 更 为 方便 了 。1DE 这 一 接口 技术 从 诞生 至 今 就 一 直 在 不 断 发 展 ， 性 能 不 断 地 提高 。 
IDE 接 口 价格 低廉 、 兼 容 性 强 ， 至 今 仍然 有 很 多 应 用 ， 但 是 范围 正在 逐步 减 小 。 


3.1.1 7 种 ATA 物 理 接口 规 沁 


平常 所 说 的 1DE 接 口 ， 也 称 为 ATA 接 口 。ATA 的 英文 全 称 为 “Advanced Technology Attachment”， 含义 是 “高 级 技术 附加 装置 ” 。ATA 接 口 最 早 是 在 
1986 年 由 康 柏 、 西 部 数据 等 几 家 公司 共同 开发 的 ， 在 20 世 纪 90 年 代 初 开始 应 用 于 台式 机 系统 。ATA 接 口 从 诞生 至 今 ， 共 推出 了 7 个 不 同 的 版 本 。 


1.ATA-1 


其 在 主板 上 有 一 个 插口 ， 支 持 一 个 主 设备 和 一 个 从 设备 ， 每 个 设备 的 最 大 容量 为 04MB。ATA-1 支 持 P1O 模 式 ， 包 括 PIO-0 和 PIO-1、P1O-2 模 式 ， 支 持 的 
P1O-0 模 式 的 传输 速率 只 有 3.3MB/s。 另 外 ATA-1 还 支持 4 种 DMA 模 式 (没有 得 到 实际 应 用 ) 。ATA-1 接 口 的 硬盘 大 小 为 ? 灰 寸 ， 而 不 是 现在 主流 的 3.5 英 十。 


2.ATA-2 


ATA-2 是 对 ATA-1 的 扩展 ， 它 增加 了 两 种 PIO 和 两 种 DMA 模 式 ， 把 最 高 传输 率 提高 到 了 16.7MB/s， 同 时 引进 了 LBA 地 址 转换 方式 ， 突 破 了 老 BIOS 固 有 
504MB 的 限制 ， 支 持 最 高 可 达 8.1GB 的 硬盘 。 如 你 的 计算 机 支持 ATA-2， 则 可 以 在 CMOS 设 置 中 找到 LBA (Logical Block Address) 或 
CHS (Cylinder，Head，Sector) 的 设置 。 它 的 两 个 插口 分 别 可 以 连接 一 个 主 设备 和 一 个 从 设置 ， 从 而 可 以 支持 四 个 设备 ， 两 个 插口 也 分 为 主 插口 和 从 插 
口 。 通 常 可 将 最 快 的 硬盘 和 CD-ROM 放 置 在 主 插 口上 ,而 将 次 要 一 些 的 设备 放置 在 从 插口 上 ， 这 种 放置 方式 对 于 486 及 早期 的 Pentium 计 算 机 是 必要 的 ， 这 样 
可 以 使 主 插口 连 在 快速 的 PCI 忌 线 上 ， 而 从 揪 口 连 在 较 慢 的 ISA 忌 线 上 。 


3.ATA-3 


ATA-3 没 有 引入 更 高 速度 的 传输 模式 ， 在 传输 速度 上 并 没有 任何 提升 ;只 在 电源 管理 方案 方面 进行 了 修改 ， 引 入 了 简单 的 密码 保护 的 安全 方案 。 但 它 引入 
了 一 个 划时代 的 技术 ， 那 就 是 9.M.A.R.T (Self-Monitoring Analysis and Reporting Technology， 自 监测 、 分 析 和 报告 技术 ) 。 这 项 技术 会 对 包括 磁头 、 盘 
片 、 电 机 、 电 路 等 硬盘 部 件 进行 监测 ， 通 过 检测 电路 和 主机 上 的 监测 软件 对 被 监测 对 象 进行 检测 ， 把 其 运行 状况 和 历史 记录 同 预 设 的 安全 值 进行 分 析 、 比 较 ， 
当 超 出 了 安全 值 的 范围 ， 会 自动 向 用 户 发 出 警告 ， 进 而 对 硬盘 潜在 故障 做 出 有 效 预 测 ， 提 高 了 数据 存储 的 安全 性 。 


4.ATA-4 
ATA-4 也 称 为 UltraATA、UltraDMA、UltraDMA33， 这 个 新 标准 将 PI10-4 下 的 最 大 数据 传输 率 提 高 了 一 倍 ， 达 到 33MB/s， 或 更 高 的 66MB/s、 


100MB/s。 它 还 在 忌 线 占 用 上 引入 了 新 的 技术 ， 即 使 用 PC 的 DMA 通 道 减少 了 CPU 的 处 理 负 答 。 要 使 用 UltraATA， 需 要 一 个 空 闪 的 PCI 扩 展 权 ， 如 果 将 
UltraATA 硬 盘 卡 插 在 |SA 扩 展 槽 上 ， 则 该 设备 不 可 能 达到 其 最 大 传输 率 ， 因 为 |SA 总 线 的 最 大 数据 传输 率 只 有 8M B/s。 


5.ATA-5 


ATA-5 也 称 为 UltraDMA66， 或 ATA66， 其 建立 在 UltraDMA33 硬 盘 接 口 的 基础 上 ， 同 样 采 用 了 UDMA 技 术 。UltraDMA66 使 主机 接收 /发 送 数据 速率 达到 
66.6MB/s， 是 U-DMAV/33 的 两 倍 。 保 留 了 上 代 UltraDMA33 的 核心 技术 元 余 校 验 技术 CRC。 在 工作 频率 提升 的 同时 ， 电 磁 干 扰 问 题 开始 出 现在 ATA 接 口中 ， 
为 保障 数据 传输 的 准确 性 ， 防 止 电 磁 干 扰 ，UltraDMA66 接 口 开始 使 用 40 针 80 芯 的 电缆 ，40 针 是 为 了 兼容 以 往 的 ATA 揪 槽 ， 减 小 成 本 的 增加 ; 80 攻 中 新 增 的 
都 是 地 线 ， 与 原 有 的 数据 线 一 一 对 应 ， 这 种 设计 可 以 降低 相 邻 信号 线 之 间 的 电磁 干扰 。 


6.ATA-6 


ATA-6 的 接口 和 数据 线 与 ATA66 一 样 ， 也 是 使 用 40 针 80 心 的 数据 传输 电 统 ， 并 且 ATA-6 的 接口 完全 向 下 兼 容 ， 支 持 ATA-4、ATA-5 接 口 的 设备 完全 可 以 继 
续 在 ATA-6 的 接口 中 使 用 。ATA-6 的 规 学 可 以 轻松 应 付 目前 ATA-4 和 ATA-5 接 口 所 棘手 的 难题 。ATA-6 可 以 让 硬盘 的 外 部 传输 率 达 到 100M B/s， 它 提高 了 硬盘 
数据 的 完整 性 与 数据 传输 率 ， 对 桌面 系统 的 磁盘 子 系统 性 能 有 较 大 的 提升 作用 ， 而 CRC 扩 术 更 有 效 地 提高 了 高 速 传输 中 数据 的 完整 性 和 可 靠 性 。 


7.ATA-7 


ATA-7 是 ATA 接 口 的 最 后 一 个 版 本 ， 也 叫 ATA133。 只 有 迈 扫 公 司 推 出 一 系列 采用 ATA133 标 准 的 硬盘 ， 这 是 第 一 种 在 接口 速度 上 超过 100M B/s 的 IDE 硬 
盘 。 迈 折 是 目前 唯一 一 家 推出 这 种 接口 标准 硬盘 的 制造 商 ， 而 其 他 IDE 硬 盘 厂 商 则 停止 了 对 IDE 接 口 的 开 友 ， 转 而 生产 Serial ATA 接 口 标准 的 硬盘 。ATA133 接 
口 广 持 133MB/s 数 据 传输 速度 ， 在 ATA 接 口 发 展 到 ATA100 的 时 候 ， 这 种 并 行 接口 的 电缆 属性 、 连 接 器 和 信号 协议 都 表现 出 了 很 严重 的 技术 扯 允 ， 而 在 技术 上 
突破 这 些 瓶 颈 仓 在 相当 大 的 难度 。 新 型 的 硬盘 接口 标准 的 产生 也 融 在 所 难免 。 


3.1.2 IDE 数据 传输 模式 


随 着 技术 的 友 展 和 产品 对 数据 传输 速度 要 求 的 提高 ，IDE 接 口 硬盘 的 数据 传输 模式 经 历 了 三 种 不 同 的 技术 ， 由 最 初 的 P10 模式 到 DMA 模 式 ， 骨 人 到 Ultra 
DMA 模 式 。 


1.PIO 模 式 


PIO 的 英文 全 称 是 “Programming InputVOutput” ，PIO 模 式 是 一 种 通过 CPU 执行 MO 端口 指令 来 进行 数据 读 写 的 数据 交换 模式 ， 是 最 早 的 硬盘 数据 传 
输 模式 ， 数 据 传 输 速 率 低下 ，CPU 占 有 率 高 ， 传 输 大 量 数据 时 会 因为 占用 过 多 的 CPU 资源 而 导致 系统 停顿 ， 无 法 进行 其 他 操作 。PIO 数 据 传输 模式 又 分 为 PIO 
mode0 (PIO-0) 、PIO mode1 (PIO-1) 、PIO mode2 (PIO-2) 、PIO mode3 (PIO-3) 和 PIO mode4 (PIO-4) 几 种 模式 ， 数 据 传 输 速 率 从 3.3MB/s 
到 16.6MB/s 不 等 。 受 限于 传输 速率 低下 和 极 高 的 CPU 占有 率 ， 这 种 数据 传输 模式 很 快 就 被 淘汰 。 


2.DMA 模 式 


DMA 的 英文 全 称 是 “Direct Memory Access”， 意 思 束 是 直接 内 存 访问 ， 是 一 种 不 经 过 CPU 而 直接 从 内 存 存 取 数据 的 数据 交换 模式 。PIO 模 式 下 硬盘 和 
内 存 之 间 的 数据 传输 是 由 CPU 来 控制 的 ， 而 在 DMA 模 式 下 ，CPU 只 需 向 DMA 控 制 器 下 达 指 令 ， 让 DMA 控 制 嚣 来 处 理 数据 的 传送 ， 数 据 传送 完毕 再 把 信息 反 
馈 给 CPU， 这 样 束 在 很 大 程度 上 减少 了 CPU 资 源 的 占有 率 。DMA 模 式 与 P10 模式 的 区 别 束 在 于 DMA 模 式 不 过 分 依赖 CPU， 可 以 大 大 节省 系统 资源 ， 二 者 在 传 
输 速 度 上 的 差异 并 不 十 分 明显 。DMA 模 式 又 可 以 分 为 Single-Word DMA (单字 节 DMA) 和 Multi-Word DMA (多 字 节 DMA) 两 种 ， 其 中 所 能 达到 的 最 大 
传输 速率 也 只 有 16.6MB/s。 


3.Ultra DM 人 A 模式 


Ultra DMA 的 英文 全 称 为 “Ultra Direct Memory Access”， 一 般 简 写 为 UDMA, 含义 是 高 级 直接 内 存 访 问 。UDM A 模式 采用 16-bit Multi-Word 
DMA (16 位 多 字 节 DMA) 模式 为 基准 ， 可 以 理解 为 DMA 模 式 的 增强 版 本 ， 它 在 包含 了 DMA 模 式 的 优点 的 基础 上 ， 又 增加 了 CRC (Cyclic Redundancy 
Check， 循 环 风 余 码 校 验 ) 技术 ， 提 高 了 数据 传输 过 程 中 的 准确 性 ， 安 全 性 也 得 到 了 保障 。 在 以 往 的 硬盘 数据 传输 模式 下 ， 一 个 时 钟 周期 只 传输 一 次 数据 ， 而 
在 UDMA 模 式 中 逐渐 应 用 了 Double Data Rate ( 双 倍 数据 速率 ) 传输 技术 ， 因 此 数据 传输 速度 有 了 极 大 的 提高 。 此 技术 就 是 在 时 钟 的 上 升 期 和 下 降 期 各 自 进 
行 一 次 数据 传输 ， 可 以 使 数据 传输 速度 成 倍增 长 。 


在 UDMA 模 式 友 展 到 UDMA133 之 后 ， 受 限于 IDE 接 口 的 技术 规 苑 ， 无 论 是 连接 器 、 连 接 电 编 、 信 号 协议 都 表现 出 了 很 严重 的 技术 瓶颈 ， 而 且 其 文 持 的 最 
高 数据 传输 率 也 有 限 。 在 IDE 接 口传 输 率 提高 ， 也 残 是 工作 频率 提高 的 同时 ， 交 叉 干扰 、 地 绪 增 多 、 信 和 号 混乱 等 缺陷 也 给 其 友 展 市 来 了 很 大 的 制约 ，IDE 接 口 被 
新 一 代 的 SATA 接 口 取代 也 融 在 所 难免 了 。 


3.2 SCSI 


SCSI (Small Computer System Interface， 小 型 计算 机 系统 接口 ) 是 1979 年 由 美国 的 施加 特 (Shugart) 公司 在 已 开 友 的 SASI 基 础 上 ， 增 加 了 磁盘 管理 
功能 而 成 的 。 它 原 是 专 为 小 型 计算 机 系统 研制 出 的 一 种 存储 单元 接口 模式 ， 但 随 着 计算 机 技术 的 发 展 ， 现 在 它 已 经 能 够 完全 应 用 到 普通 的 PC 上 ， 支 持 包括 硬 
盘 、 光 驱 、 扫 描 仪 等 在 内 的 各 种 设备 。 


SCSI 协 议 由 SASI 协 议 友 展 而 来 ， 于 1985 年 由 美国 国家 标准 协会 (American National Standard Institute，ANSI) 审议 通过 。SASI 接 口 类 似 于 现在 的 
IDE 接 口 ， 扩 展 总 线 与 控制 器 之 间 为 一 一 对 应 关系 ,扩展 总 线 将 指令 送 至 控制 器 ， 由 控制 器 加 以 解释 并 执行 。 而 SCSI 接 口 的 性 能 比 SASI 要 高 得 多 ， 它 不 像 SASI 
只 能 串 接 两 个 外 围 设备 ， 而 是 可 以 同时 串 接 7 个 外 围 设备 (SCSI-3 可 同时 串 接 15 个 外 围 设备 ) 。 另 外 ， 这 些 外 围 设备 在 串 接 时 无 须 考虑 配对 关系 ， 而 且 接 口 卡 
与 控制 器 的 天 系 也 是 对 等 的 。SC9| 总 线 是 连接 9C9I 接 口 卡 与 SC9SI 外 围 设备 的 桥梁 ， 每 个 外 围 设备 均 内 合 控 制 器 ， 专 门 负责 解释 SCSI 协 议 。 当 有 数据 要 传送 
时 ， 送 出 命令 的 一 方 称 为 启动 方 (Initiation) ， 接 收 数据 的 一 方 称 为 目标 方 (Target) ， 控 制 器 也 能 成 为 司 动 方 ， 将 命令 送 到 接口 卡 ， 或 者 在 控制 器 间 进 行 
数据 交 损 。SC3I 总 线 上 的 外 围 设备 均 以 SCSI1D 的 标识 符号 加 以 识别 ，1D 号 为 0~ 7 (或 0~ 15) 。 此 外 ，SCSI ID 也 可 用 来 标识 每 个 设备 的 优先 级 ，ID7 (或 
ID15) 优先 级 最 高 ， 然 后 依次 递 碱 。 当 同时 有 两 个 外 围 设备 申请 总 绪 使 用 时 ， 可 按 优先 级 进行 仲裁 。 


3.2.1 SCS| 电 和 气 特征 


在 SCSI 忆 线 的 结构 上 ， 各 设备 间 以 “菊花 链 式 ” (daisy-chain) 的 方式 捉 接 起 来 ， 当 信号 进入 外 围 设备 时 由 接收 回路 接收 信号 ， 当 信号 从 外 围 设备 往外 
送出 时 由 驱动 回路 友 送 ， 从 而 使 信号 在 总 线 的 传送 中 不 全 于 衰减 到 无 法 辨识 的 程度 。 值 得 注意 的 是 ， 在 3Cs| 总 续 的 两 端 必须 要 连接 终端 阻抗 一 SC9| 终 结 
器 。 


SCSI 接 口 在 传输 系统 的 电气 规格 上 有 两 种 不 同 的 规格 : 不 平衡 型 (Single-Ended) ， 最 大 线 绕 长 为 6m; 平衡 型 (Differential-Ended) ， 最 大 线 线 长 为 
25m。 这 两 种 传输 系统 间 的 电气 与 物理 特性 是 不 可 以 互 换 的 。 


3.2.2 SCS| 接 口 协议 


SCSI 的 控制 是 按照 一 定 的 流程 进行 的 ， 这 些 流程 被 设计 成 一 个 个 独立 的 “阶段 ”。 所 谓 阶 段 束 是 一 些 标准 化 的 操作 流程 ， 几 是 类 似 数 据 传输 、 仲 裁 等 且 有 
规律 的 活动 都 被 安排 成 独立 的 工作 流程 ， 因 此 各 阶段 的 动作 可 独立 完成 ， 也 可 将 几 个 阶段 的 过 程 连接 起 来 作为 较 复 杂 的 流程 处 理 。 依 据 标准 规格 ，SCSI 接 口 共 
有 8 种 不 同 的 忌 线 阶 段 (Bus Phase) ， 而 同一 时 间 内 只 能 有 一 个 总 线 阶 段 操作 。 这 8 种 总 线 阶 段 分 别 如 下 。 


1) 总 线 空 档 阶 段 (Bus Free Phase) : 没有 任何 设备 占有 忆 线 的 状态 。 


2) 仲裁 阶段 (Arbitration Phase) : 当 有 一 个 以 上 的 设备 要 求 使 用 总 线 时 ， 此 阶段 会 局 动 ， 以 决定 哪 一 个 设备 可 以 使 用 总 线 。 由 于 每 一 个 设备 使 用 总 绪 
的 机 会 相等 ， 因 此 只 要 哪 一 个 设备 先 提出 请 求 则 优先 使 用 。 各 有 多 个 设备 同时 提出 使 用 总 线 ， 则 交 给 仲裁 者 (Arbitrator) 裁决 标识 编号 级 别 最 大 的 获得 使 用 
权 。 


3) 选择 阶段 (Select Phase) : 取得 总 续 使 用 权 的 设备 成 为 局 动 方 ， 选 择 欲 传 给 命令 的 目标 方 。 在 此 阶段 中 ， 初 步 决 定局 动 方 与 目标 方 ， 然 后 两 者 之 间 
进行 数据 交换 。 


4) 命令 阶段 (Command Phase) : 发 送 命令 的 阶段 。 

5) 数据 传送 阶段 (Data Phase) : 局 动 方 往 目 标 方 传送 数据 的 阶段 。 
6) 状态 阶段 (Status Phase) : 目标 方向 启动 方 送出 状态 信息 的 阶段 。 
7) 信息 发 送 阶 段 (Message Phase) : 友 送 信息 的 阶段 。 


8) 再 选择 阶段 (Reselect Phase) : 如 果 局 动 方 与 目标 方 的 数据 传输 因 故 中 断 ， 当 事故 结束 后 ， 便 可 以 从 此 阶段 将 以 前 的 连接 关系 重 新 建立 起 来 。 


3.2.3 ”SCS| 接 口 的 发 展 


前 面 所 介绍 的 是 SCSI-1 的 规格 ,而 SCS1-2 则 是 将 SCSI-1 设 计 上 的 功能 加 以 扩展 或 改进 的 新 标准 规格 。 目 前 市 面 上 所 售 的 SCSI 接 口 已 全 面 改换 成 SCS1-2 的 
规格 ,但 仍 能 与 旧 的 SCSI-1 规 格 兼 容 。SCS1-3 则 是 下 一 代 SCSI 接 口 标准 ， 在 此 规格 中 ，SCSI 将 具有 “ 即 插 即 用 ”功能 和 光纤 通信 等 能 力 。 下 面 天 SCS1-2 及 
SCSI-3 新 增 性 能 进行 曾 述 。 


SCS1-2 的 新 增 性 能 如 下 : 


1) Fast-SCSI。 它 将 传送 时 钟 高 速 化 ， 在 SCS1-1 接 口中 从 目标 方 或 启动 方 送出 信号 到 回 送 信和 号 接收 到 的 最 短 时 间 | 间隔 为 180ns， 而 在 SCS1-2 接 口中 此 时 间 
仅 为 60ns， 比 SCSI-1 快 3 倍 。 


2) Wide-sCsl。Wide-sCsl 融 是 将 数据 传送 宽度 从 8 位 提高 到 16 位 或 32 位 。 


3) 指令 队列 (command queuing) 。SCSI-2 在 每 个 逻辑 设备 中 均 设 计 有 指令 队列 ， 它 一 次 最 多 能 容许 256 个 指令 存放 在 逻辑 设备 中 ， 这 样 局 动 方 或 目 
标 方 可 一 次 上 友 送 数 十 条 命令 ， 而 不 必 等 竺 对 方 回 应 再 送出 。 


4) 指令 集 增强 (Command set enhancement) 。 在 SCSI-2 的 接口 规格 中 ， 将 SCSI-1 部 分 的 指令 做 了 更 加 详细 而 严谨 的 定义 ， 并 增加 了 文 持 新 功能 的 控 


制 命令 。 
5) 高 速 缓存 (caching) 。 在 外 围 设备 的 高 速 缓存 已 成 为 趋势 的 情况 下 ，SCSI1-2 命 令 集 加 入 了 控制 高 速 缓存 的 指令 。 


6) 支持 更 多 的 设备 类 型 (more device type) 。 在 SCSI-1 的 定义 中 ， 容 许 连 接 许多 不 同类 型 的 外 围 设备 ， 在 SCS1-2 的 规格 中 扩大 了 应 用 范围 ， 将 光学 存 
储 设备 与 通信 设备 也 纳入 其 中 了 。 


SCS1-3 的 新 增 性 能 如 下 : 


1) 自动 配置 (auto configuration) 。 对 于 目前 的 SCSI-1 和 SCSI-2， 其 接口 卡 及 外 围 设备 都 必须 仔细 留意 系统 资源 的 配置 ， 以 免 友 生 冲 突 ， 而 SCS1-3 的 
规格 设计 中 纳入 了 “ 即 插 即 用 ”功能 ， 可 免除 繁杂 的 计算 机 资源 设置 工作 。Adaptec 公 司 最 新 推出 的 SCSI 接 口 卡 就 支持 SCAM (SCSI Configured 
Automatically，SCSI 自 动 配置 ) 协议 ， 在 计算 机 局 动 后 能 动态 分 配 SCSI ID， 从 而 自动 避免 了 SCSI 1D 冲突 。 


2) 多 于 8 个 设备 (more than8device per bus) 。SCSI-1 与 SCS1-2 所 能 连接 的 设备 极限 为 8 个 ， 而 SCSI-3 的 规格 定义 里 突破 了 8 个 设备 的 限制 。 目 前 已 出 
现 了 最 多 串 接 16 个 设备 的 接口 卡 。 


3) 支持 光纤 (fiber optic option) 。 目 前 连接 SCSI 接 口 卡 与 外 围 设备 的 传输 媒介 是 电 比 ， 随 着 光纤 技术 的 普及 ， 其 独 具 的 抗 电子 噪声 和 高 速 数 据 传送 的 
能 力 ， 也 为 SCSI 接 口 所 考虑 。 在 某 些 需要 高 速 数据 传输 或 电磁 干扰 严重 的 领域 ， 可 选择 光纤 来 作为 SCSI 接 口 卡 与 外 围 设备 的 传输 媒介 。 


4) 更 长 的 绪 缆 (longer cable) 。3C3I 的 设计 是 逐渐 朝 网 络 化 及 多 功能 化 的 方向 友 展 的 ， 为 了 能 连接 更 远 闯 的 设备 ， 融 必须 加 长 线 缆 的 长 度 。 目 前 低压 
差 动 的 SC9I 设 备 的 可 靠 连接 距离 已 扩展 全 12m。 


5) 文件 服务 器 指令 集 (file server command set) 。 网 络 是 个 人 计算 机 发 展 的 重要 趋势 ，SC39| 接 口 具有 快速 的 数据 传输 速率 及 可 连接 较 多 设备 的 特性 ， 
因此 网 络 上 的 文件 服务 器 大 多 配 有 SCSI 接 口 ， 为 此 ，SCS1-3 将 文件 服务 器 的 指令 也 加 入 到 其 规格 中 。 


3.2.4 ” SCSI 与 1DE 的 比较 


IDE 是 个 人 计算 机 连接 硬盘 、 光 盘 等 设备 的 基本 接口 ， 具 有 性 价 比 高 、 适 用 面 广 等 特点 。 而 SCS| 是 一 种 特殊 的 思 线 结构 ， 可 以 对 计算 机 中 的 多 个 设备 进行 
动态 分 工 操 作 ， 对 于 系统 同时 要 求 的 多 个 任务 可 以 灵活 机 动 地 适当 分 配 、 动 态 完成 。 这 个 功能 是 1DE 设 备 所 望尘莫及 的 。 同 IDE 相 比 ，SCSI 的 优点 主要 表现 为 
以 下 几 氮 。 


1. 扩 展 能 力 强 


由 于 IDE 接 口 与 5CSI 接 口 功能 相近 ， 因 此 经 常 放 在 一 起 讨论 ， 表 3-1 是 SCSI 接 口 与 1DE 接 口 的 简单 对 比 表 ， 从 对 照 表 中 可 以 看 出 两 者 的 差异 。 使 用 IDE 接 口 
时 ， 将 会 受到 系统 IRQ (中断 号 ) 及 IDE 通 道 的 限制 ， 一 般 情 况 下 每 个 IDE 通 道 使 用 一 个 IRQ， 因 此 一 个 标准 的 主板 只 能 使 用 两 个 IRQ， 而 每 两 个 设备 要 占据 一 
个 1DE 通 道 ， 因 此 一 个 标准 主板 最 多 只 能 接 4 个 1DE 设 备 。 而 SCSI 接 口 可 连接 7 个 以 至 更 多 个 设备 ， 且 所 有 这 些 设备 只 占用 一 个 IlRQ， 这 也 是 SCSI 逐 渐 普 及 的 原 
因 之 一 。 


表 3-1 SCSI 接 口 与 IDE 接 口 对 比 





SCSI 接口 IDE 接口 
硬盘、 光驱 、ZIP、MO、 扫 描 仪 、 磁 带 机 、 
A 人 硬盘、 光驱 、ZIP、LS 
可 使 用 设备 JAZ、 打 印 机 更 盘 、 光 驶 
( 绥 ) 
SCSI 接口 IDE 接口 
可 连接 设备 数 最 多 可 接 4 个 
安装 方式 可 内 接 或 外 接 ; 安 痛 步骤 相同 只 能 内 接 





传输 速率 5 ~ 160MB/s 3.3 ~ 66MB/s 
价格 便宜 


主板 功能 部 分 内 置 ， 通 常 需 日 行 扩 充 内 置 





SCSI 卡 比 IDE 接 口 有 更 快 的 数据 传输 率 ， 尤 其 是 在 同时 传输 多 组 数据 时 就 更 能 显示 出 威力 。 因 此 ，SCSI 设 备 适 合用 于 图 像 处 理 ， 在 图 像 处 理 领 域 中 一 直 独 
占 警 头 的 苹果 公司 的 机 型 一 律 采 用 SCSI 接 口 。 


4. 低 CPU 占 用 率 


1DE 的 工作 方式 需要 CPU 全 程 参 与 ，CPU 读 写 数 据 的 时 候 不 能 再 进行 其 他 操作 ， 这 种 情况 在 Windows95VNT 的 多 任务 操作 系统 中 目 然 融会 导致 系统 反应 速 
度 的 大 大 减 慢 。 而 SCSI 接 口 则 完全 通过 独立 的 高 速 SCSI 卡 来 控制 数据 的 读 写 操作 ，CPU 束 不 必 沪 费时 间 进 行 等 待 ， 这 样 可 以 提高 系统 的 整体 性 能 。 在 早期 
SCSI 接 口 下 ，CPU 将 传输 指令 传送 给 SCSI 之 后 ， 可 随即 处 理 后 续 指令 ， 传 输 的 工作 则 交 由 SCSI 卡 上 的 处 理 心 片 自行 负责 ， 且 传输 过 程 为 DMA 方 式 ， 由 SCSI 直 
接 访问 内 存 ， 待 SCSI 处 理 完毕 ， 发 出 信号 通知 CPU，CPU 青 进行 后 续 处 理 即 可 。 目 前 “ 即 揪 即 用 ”的 SCSI 卡 虽然 也 改 用 忆 线 主 控 (Bus Mastering) ， 不 过 由 
于 SCSI 卡 本 身高 有 CPU， 可 处 理 一 切 SCSI 设 备 的 事务 ， 所 以 CPU 资 源 的 占有 率 还 是 相当 低 的 。 虽 然 SCSI 有 性 能 稳定 、 可 靠 性 良好 、 效 率 高 等 各 方面 的 优 操 ， 
但 相对 于 1DE 也 不 是 没有 缺点 ， 由 于 SCsl 主 要 针对 商业 用 户 应 用 ， 外 围 设置 比较 复杂 ， 所 以 SC3I 一 向 是 “高 价格 ”的 代名词 ， 这 融 局 限 了 它 的 使 用 沧 围 。 


3.3 SATA 


SATA 是 serial ATA 的 缩写 ， 即 串 行 ATA， 这 是 一 种 完全 不 同 于 并 行 ATA 的 新 型 硬盘 接口 类 型 。2001 年 ， 由 Intel、APT、Dell、IBM、 和 希捷、 迈 拓 这 几 大 厂 
商 组 成 的 Serial ATA 委 员 会 正式 确立 了 Serial ATA1.0 规 范 ， 在 当年 的 IDF Fall 大 会 上 上， 希捷 宣布 了 Serial ATA1.0 标 准 ， 正 式 宣 告 了 SATA 规 范 的 确立 。 


3.3.1 SATA 接 口 的 组 成 


SATA 是 一 种 完全 不 同 于 并 行 ATA 的 新 型 硬盘 接口 类 型 ， 由 于 及 用 捉 行 方式 传输 数据 而 得 名 。SATA 忆 线 使 用 嵌入 式 时 钟 信号 ， 具 备 了 更 强 的 纠 错 能 力 ,与 
以 往 相 比 最 大 的 区 别 在 于 它 能 对 传输 指令 (不 仅仅 是 数据 ) 进行 检查 ， 如 果 友 现 错误 会 目 动 笑 正 ， 这 人 在 很 大 程度 上 提高 了 数据 传输 的 可 靠 性 。 串 行 接口 还 具有 
结构 简单 、 支 持 热 插 拔 的 优点 。 


SATA 接 口 包括 SATA 控 制 器 和 SATA 物 理 层 。SATA 物 理 层 通过 SATA 连 接线 与 主机 和 连接，SATA 控 制 器 通过 AHB 从 接口 和 AHB 主 接口 连接 到 总 线 。 此 外 ， 辟 
线 上 还 连接 了 控制 硬盘 的 微 处 理 器 、 内 人 存 等 器 件 。 


SATA 接 口 物理 层 采 用 7 根 电 缠 线 与 主机 连接 ， 其 中 3 根 为 地 线 ， 一 对 差分 数据 输入 线 ， 一 对 差分 数据 输出 线 。 物 理 层 实现 差分 串 行 数据 传输 ， 提 供 1000 的 
传输 终端 和 接收 终端 电阻 匹配 ， 实 现 将 并 行 输入 的 数据 捉 行 传输 ， 从 捉 行 数据 流 中 接收 需要 的 数据 ， 并 将 捉 行 数据 转换 为 并 行 数据 传输 ;为 链 路 层 提 供 当 前 控 
制 器 状态 ， 通 过 使 用 专用 OOB 协 议 实 现 SATA 接 口 物理 层 的 连接 初始 化 ， 并 用 OOB 信 号 队列 执行 预定 义 的 速度 ; 使 用 本 地 器 件 时 钟 向 主机 友 送 数据 ， 使 用 接收 
时 钟 从 主机 读 取 数据 。 


3.3.2 ” ”SATA 协议 介 绍 


下 面 以 SATA1.0 协 议 为 例 进行 简单 介绍 ，SATA1.0 协 议 可 以 分 为 四 个 层次 : 物理 层 、 链 路 层 、 传 输 层 和 应 用 层 ， 如 图 3-1 所 示 。 


标准 主机 信条 


软件 控制 、 | 软件 控制 
内 存 缓冲 | 访 用 居 
DMA 引 擎 


内 存 缓 冲 
DMA 引 擎 


串 行 数据 
一 - 传 园 层 一 ”| 传输 控制 





品行 数据 | 。 ww， | 串 行 数据 
链 路 控制 链 路 层 链 路 控制 


一 -物理 层 -一 -一 





主机 属 议 首 议 备 层 设 首 


其 中 物理 层 负责 传输 上 层 协议 的 位 沅 ， 有 收 皮 两 个 独立 的 通道 ， 每 个 通道 使 用 一 对 差分 线 。 在 输出 端 ， 并 行 数据 通过 编码 、 误 码 检 测 、 并 串 转换 后 被 放 到 


高 速 串 行 忌 线 传输 ;在 接收 端 ， 接 收 串 行 数据 并 反馈 到 采样 器 和 时 钟 恢复 单元 ， 恢 复 玉 样 时 钟 ， 接 收 到 的 数据 经 过 采样 形成 位 流 ， 同 步 成 字 以 后 被 解 串 和 解 


链 路 层 的 功能 是 接收 或 友人 送 数据 帧 ， 根 据 传输 层 的 控制 信号 进行 原 语 通信 传输 ， 以 及 从 物理 层 接收 原 语 用 来 控制 传输 层 的 操作 。 链 路 层 对 所 传输 的 内 容 不 
做 处 理 ， 只 是 将 原 语 加 入 数据 帧 或 将 接收 到 的 数据 帧 的 原 语 删 除 ， 通 过 原 语 来 控制 数据 帧 的 传输 。 链 路 层 通过 弹性 缓存 消除 主机 和 器 件 乙 间 的 频率 以 及 相位 的 
差异 ， 当 传输 层 要 求 进行 帧 传输 时 ， 链 路 层 将 提供 以 下 服务 : 当主 机 和 器 件 同 时 友 出 传输 数据 的 请 求 时 由 仲裁 决定 ; 将 传输 层 友 送 过 来 的 数据 加 上 原 语 ， 以 双 
字 节 的 方式 从 传输 层 取出 数据 ， 对 传输 层 友 送 过 来 的 数据 进行 CRC 编 码 ， 以 数据 帧 的 方式 传输 ;根据 链 路 层 的 输入 输出 缓存 FIFO 和 主机 链 路 层 的 要 求 进行 数据 
帧 的 传输 ; 接收 主机 链 路 层 的 应 答 信号 ， 将 传输 过 程 的 结果 通知 传输 层 ; 将 数据 加 扰 来 避免 由 电磁 干扰 产生 的 传输 错误 。 


传输 层 不 会 改变 传输 的 数据 结构 ， 只 将 要 传输 的 数据 打包 成 数据 帧 的 结构 ， 并 将 接收 到 的 数据 帧 还 原 。 传 输 层 根据 需要 将 数据 组 合成 数据 帧 ， 通 知 链 路 层 
要 进行 数据 传输 。 传 输 层 对 缓 仓 进 行 监控 ， 并 根据 监控 的 情况 控制 链 路 层 进行 数据 传输 ， 并 接收 来 自 于 链 路 层 的 应 答 信息 ， 向 应 用 层 通知 上 次 传输 是 否 正确 。 
当 传输 层 从 链 路 层 接收 到 数据 帧 后 ， 传 输 层 将 进行 解 帧 并 将 数据 帧 还 原 为 需要 存储 的 数据 沈 。 当 链 路 层 接收 数据 帧 后 ， 判 断 数据 帧 的 类 型 ， 根 据 帧 的 类 型 将 数 
据 分 配 到 具体 位 置 ， 并 向 应 用 层 报告 数据 接收 是 否 成 功 。 


SATA 应 用 层 和 ATA 协 议 中 的 应 用 层 功 能 一 样 ， 当 主机 的 BIOS 程 序 向 硬盘 控制 器 友 送 主机 命令 时 ，SATA 应 用 层 对 主机 友 送 过 来 的 SATA 命 令 进行 解析 和 执 
行 ， 因 此 SATA 应 用 层 通 过 命令 和 控制 寄存 器 来 接收 命令 ， 完 成 命令 或 执行 命令 的 过 程 中 通过 设置 状态 寄存 器 向 主机 通知 当前 的 状态 ， 为 硬盘 控制 器 的 微 处 理 
器 提供 当前 的 执行 状态 ,使 得 硬盘 系统 软件 根据 当前 的 情况 来 继续 下 一 步 操作 ， 并 通过 设置 相应 的 寄存 器 控制 传输 层 进行 数据 的 传输 操作 。 同 时 应 用 层 还 包括 
对 SATA 器 件 内 部 DMA 的 控制 ， 通 过 配置 DMA 控 制 器 来 实现 数据 的 快速 传输 。 


3.3.3 ”SATA 兼容 性 


SATA 规 范 不 仅 立 足 于 未 来 ， 而 且 还 保留 了 多 种 向 后 兼容 方式 ， 在 使 用 上 不 存在 兼容 性 问题 。 在 硬件 方面 ，SATA 标 准 中 允许 使 用 转换 器 提供 同 并 行 设备 的 
兼容 性 ， 转 换 器 能 把 来 目 主板 的 并 行 ATA 信 号 转换 成 SATA 硬 盘 能 够 使 用 的 串 行 信 号 ， 目 前 已 经 有 多 种 此 类 转 接 卡 / 转 接 头 上 市 ， 这 在 某 种 程度 上 保护 了 企业 的 
原 有 投资 ， 减 小 了 升级 成 本 。 在 软件 方面 ，SATA 和 并行 ATA 保 持 了 软件 兼容 性 ， 这 意味 着 厂商 丝 富 也 不 必 为 使 用 SATA 而 重 写 任何 驱动 程序 和 操作 系统 代码 。 
另外 ，SATA 接 线 较 传统 的 并 行 ATA (Paralle ATA，PATA) 接线 要 入 单 得 多 ,而 且 容 易 收 放 ， 对 机 箱 内 的 气流 及 散热 有 明显 改善 。 而 且 SATA 硬 盘 与 始终 被 困 
在 机 箱 之 内 的 并 行 ATA 不 同 ， 扩 充 性 很 强 ， 即 可 以 外 置 ， 外 置式 的 机 柜 (JBOD) 不 但 可 提供 更 好 的 散热 及 插 拔 功能 ， 而 且 可 以 多 重 连 接 来 防止 单 点 故障 ; 由 
于 SATA 和 光纤 通道 的 设计 如 出 一 辐 ， 所 以 传输 速度 可 用 不 同 的 传输 通道 来 做 保证 ， 这 对 服务 器 和 网 络 存储 具有 重要 意义 。 


3.3.4 ”SATA 的 优点 和 不 足 


SATA 是 相对 于 PATA 硬 盘 总 线 而 言 的 一 种 串 行 架 构 ， 采 用 点 对 点 半 双 工 传输 方式 ， 利 用 单个 路 径 串 行 传输 数据 ， 并 用 另外 一 条 路 径 给 发 送 端 返 回 接收 确认 
言 息 。 每 条 路 径 都 是 由 两 根 导线 构成 的 差分 对 ， 因 此 SATA 总 绪 的 每 个 通道 由 4 条 信号 线 组 成 。 控 制 信息 的 传输 利用 以 分 组 格式 预先 定义 且 能 与 数据 区 别 的 位 序 
列 ， 或 者 利用 段 外 信号 传送 ， 不 需要 单独 的 传输 线 。SATA1.0 接 口 采 用 1.5GHz 的 内 内 时 钟 ， 约 为 并 行 时 钟 的 30 倍 。SATA1.0 的 最 大 吞吐 量 为 150MB/s。 
SATA2.0 的 传输 速率 为 300MB/s，SATA3.0 的 传输 速率 为 600MB/s。SATA 的 主要 优点 如 下 。 


1) SATA 及 用 点 对 点 传输 协议 。 对 主机 而 言 ， 所 有 连接 的 磁盘 的 地 位 对 等 ， 不 存在 PATA 协 议 中 的 “ 主 / 从 ” 间 题 。 此 外 ， 点 对 点 传输 模式 使 得 每 个 通道 都 
能 独 享 宽 市 ， 有 效 提高 了 设备 连接 的 灵活 性 和 硬盘 的 性 能 ， 也 使 RAID 配 置 更 加 容易 。 


2) SATA 有 良好 的 兼容 性 。SATA 与 PATA 两 者 的 软件 和 驱动 程序 完全 透明 ，SATA 不 必 对 现 有 的 操作 系统 代码 和 各 种 驱动 程序 做 任何 修改 就 可 以 正常 运 
作 。 


3) SATA 的 连接 线 更 轻 注 、 更 灵活 ， 避 免 了 系统 内 的 布线 拥塞 ， 增 加 了 空气 流通 ， 有 利于 系统 散热 。 同 时 ，SATA 的 连接 器 由 于 针脚 少 ， 大 大 降低 了 PCB 
制 板 的 复杂 度 。 


4) 相对 于 PATA 只 对 数据 进行 CRC 校 验 ，SATA 增 加 了 对 命令 的 CRC 校 验 。CRC 检 测 所 有 单位 和 双 位 错误 ， 能 够 检测 出 99.9% 的 可 能 错误 。 因 此 ，SATA 总 
线 的 可 靠 性 得 到 了 进一步 的 提高 。 


5) SATA 在 连接 器 的 设计 中 采用 地 针 加 长 、 最 小 插入 力 设计 和 背 板 互 连 等 技术 ， 使 得 SATA 支 持 热 插 拔 ， 在 操作 系统 中 实现 即 插 即 用 。 


6) SATA 采 用 了 原生 命令 排队 技术 ， 在 队列 中 最 多 可 以 有 32 条 待 处 理 命 令 ， 这 项 技术 使 硬盘 可 在 内 部 优化 工作 负 倚 执行 顺序 ， 让 硬盘 更 有 效 地 指挥 排队 命 
令 的 执行 。 
时 然 SATA 在 单 任 务 的 测试 中 不 比 SCsl 差 ， 但 面 对 大 数据 吞吐 量 的 服务 器 时 还 是 有 差距 的 。 除 了 速度 乙 外 ， 面 对 多 任务 数据 读 取 、 硬 盘 磁 头 频繁 地 来 回 摆 


动 ， 使 得 硬盘 过 热 是 SATA 最 大 的 问题 。 


在 实际 应 用 中 ，RAID 硬 盘 阵 列 是 由 多 个 硬盘 组 成 的 ， 必 须知 道 损 坏 的 具体 硬盘 ， 热 插 拔 更 损 才 有 意义 。SATA 硬 盘 虽 然 可 以 热 插 拔 ， 但 SATA 组 成 的 阵列 
在 某 块 硬盘 损坏 的 时 候 ， 不 能 像 SCSI、FC 和 和 SAS 那样 具有 SAF-TE 机 制 用 指示 灯 显 示 ， 以 便 知 道具 体 坏 的 是 哪 一 块 。 所 以 在 实际 应 用 中 ，SATA 的 热 插 拔 功 能 


氮 形 同 虚 设 了 。 


SATA 相 对 于 SCSI 和 FC 速度 慢 ， 主 要 原因 是 机 械 底 盘 不 同 ， 不 适应 服务 器 应 用 程序 大 量 非 线 性 读 取 的 请 求 。 所 以 SATA 硬 盘 用 来 作为 视频 下 载 服务 器 还 不 
错 ， 用 在 网 上 交易 平台 时 则 力不从心 。 


3.4 其 他 接口 
除了 以 上 介绍 的 几 种 主要 接口 技术 外 ， 还 有 其 他 一 些 物理 存储 接口 ， 下 面 简要 介绍 。 


3.4.1 PCI-E 


PCI 总 线 使 用 并 行 总 线 结构 ， 在 同一 条 总 线 上 的 所 有 外 部 设备 共享 总 线 带宽 ， 而 PCI-E 总 线 使 用 了 高 速 差 分 总 线 ， 并 采用 庙 到 端的 连接 方式 ， 因 此 在 每 一 条 
PCI-E 链 路 中 只 能 连接 两 个 设备 。 这 使 得 PCI-E 与 PCI 总 线 采用 的 拓扑 结构 有 所 不 同 。PCI-E 总 线 除 了 在 连接 方式 上 与 PCI 总 线 不 同 之 外 ， 还 使 用 了 在 网 络 通信 中 
使 用 的 一 些 技术 ， 如 支持 多 种 数据 路 由 方式 、 基 于 多 通路 的 数据 传递 方式 和 基于 报 文 的 数据 传送 方式 ， 并 充分 考虑 了 在 数据 传送 中 出 现 服务 质量 Qos 的 问题 。 


1. 端 到 端的 数据 传递 


PCI-E 链 路 使 用 “ 端 到 端的 数据 传送 方式 ”， 友 送 端 和 接收 端 中 都 含有 TX ( 友 送 逻辑 ) 和 RX (接收 逻辑 ) ， 其 结构 如 图 3-2 所 示 。 
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图 3-2 ” 端 到 端的 数据 传送 方式 


由 图 3-2 所 示 ， 在 PCI-E 总 线 的 物理 链 路 中 的 一 个 数据 通路 (Lane) 由 两 组 差分 信号 共 4 根 信号 线 组 成 。 其 中 发 送 端 的 TX 部 件 与 接收 端的 RX 部 件 使 用 一 组 
磊 分 信号 连接 ， 该 链 路 也 称 为 友 送 端的 友 送 链 路 ， 也 是 接收 端的 接收 链 路 ;而 发 送 端 的 RX 部 件 与 接收 端的 TX 部 件 使 用 另 一 组 差分 信号 连接 ， 该 链 路 也 称 为 友 
送 站 的 接收 链 路 ， 也 是 接收 端的 友 送 链 路 。 一 个 PCI-E 链 路 可 以 由 多 个 数据 通路 组 成 。 


2.PCl-E 总 线 的 层次 结构 


PCI-E 忌 线 采 用 捉 行 连接 方式 ， 并 使 用 数据 包 (Packet) 进行 数据 传输 ， 采 用 这 种 结构 有 效 去 除了 在 PCI 总 线 中 存在 的 一 些 边 市 信号 ， 如 INTx 和 PM E# 等 
言 号 。 人 在 PCI-E 总 线 中 ， 数 据 报 文 在 接收 和 友和 送 过 程 中 需要 通过 多 个 层次 ， 包 括 事 务 层 、 数 据 链 路 层 和 物理 层 。 PCI-E 总 绪 的 层次 结构 如 图 3-3 所 示 。 
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图 3-3 PCI-E 总 线 的 层次 结构 


PCI-E 总 线 的 层次 组 成 结构 与 网 络 中 的 层次 结构 有 类 似 之 处 ， 但 是 PCI-E 总 线 的 各 个 层次 都 是 使 用 硬件 逻辑 实现 的 。 在 PCI-E 体 系 结构 中 ， 数 据 报 文 首先 在 
设备 核心 层 (Device Core) 中 产生 ， 然 后 再 经 过 该 设备 的 事务 层 (Transaction Layer) 、 数 据 链 路 层 (Data Link Layer) 和 物理 层 (Physical Layer) ， 最 
终 帮 送出 去 。 而 接收 端的 数据 也 需要 通过 物理 层 、 数 据 链 路 层 和 事务 层 ， 并 最 终 到 达 设 备 核心 层 。 


3.4.2 FC 


光纤 通道 (Fibre Channel，FC) 以 COTS 为 基础 ， 支 持 |/O 通 道 所 要 求 的 市 完 、 可 靠 性 以 及 网 络 技术 的 灵活 性 、 连 接 能 力 和 距离 ， 使 得 在 同一 物理 接口 之 
上 运行 当今 主流 通道 标准 和 网 络 协 议 成 为 可 能 ， 现 已 成 为 一 种 高 速 传输 数据 、 音 频 和 视频 信号 的 ANSI 串 行 通信 标准 。 目 前 ， 国 际 上 光纤 通道 在 商用 领域 中 已 
被 广泛 采用， 很 多 公司 和 研究 机 构 现 在 已 经 开发 出 光纤 通道 的 网 络 适 配 卡 、 和 存储 设备 、 路 由 器 以 及 相关 的 测试 设备 。 


光纤 通道 的 优点 如 下 : 


1) 高 市 帝 、 多 媒介 、 长 距离 传输 。 光 纤 传 输 一 般 使 用 光缆 进行 ， 理 论 上 囊 宽 可 达 30 人 2 兆 薪 将 ， 单 根 光 导 纤维 的 数据 传输 速率 能 达 几 Gbit/s， 在 不 使 用 中 
继 器 的 情况 下 传输 距离 能 达 几 十 干 米 ， 数 据 吞 吐 量 大 ， 适 用 于 不 同 模块 间 的 大 规模 应 用 数据 (如 音频 、 视 频数 据 流 ) 交换 。 


2) 可 靠 性 与 实时 性 。 光 纤 通 道 的 传输 位 差错 率 低 于 10-12; 端 到 并 传输 延迟 量 级 小 于 10pns， 支 持 非 应 答 方 式 与 传感器 数据 传输 ， 可 以 满足 快速 交付 的 性 
能 等 级 要 求 。 


3) 统一 性 与 可 扩展 性 。 可 方便 地 增加 和 减少 节点 以 满足 不 同 应 用 的 需求 ， 拓 扑 结构 灵活 ， 支 持 多 层次 系统 互 连 ; 利用 高 层 协 议 映射 提供 强大 的 兼容 和 适 
应 能 力 ， 可 有 效 地 减少 物理 器 件 与 附加 设备 的 种 类 并 降低 经 济 成 本 。 


4) 开放 式 互 连 。 遵 循 统 一 的 国际 标准 ， 可 确保 不 同 生产 厂商 的 产品 能 够 互相 协作 使 用 。 


3.4.3 SAS 


SAS (Serial Attached SCSI， 串 行 连 接 SCSI) 是 新 一 代 的 SC9I 技 术 ， 是 并 行 9CS| 接 口 之 后 开 友 出 的 全 新 接口 。 此 接口 的 设计 是 为 了 改善 存储 系统 的 效 
能 、 可 用 性 和 扩充 性 ， 并 且 提 供与 SATA 硬 盘 的 兼容 性 。SAS 接 口技 术 可 以 向 下 兼容 SATA。 二 者 的 兼容 性 主要 体现 为 物理 层 和 协议 层 的 兼容 。 在 物理 层 ，SAS 
接口 和 SATA 接 口 完 全 兼容 ，SATA 硬 盘 可 以 直接 使 用 在 SAS 的 环境 中 ， 从 接口 标准 上 而 言 ，SATA 是 SAS 的 一 个 子 标准 ， 因 此 SAS 控 制 器 可 以 直接 操控 SATA 硬 
盘 ， 但 是 SAS 却 不 能 直接 使 用 在 SATA 的 环境 中 ， 因 为 SATA 控 制 器 并 不 能 对 SAS 硬 盘 进 行 控 制 。 在 协议 层 ，SAS 由 3 种 类 型 协议 组 成 ， 根 据 不 同 的 连接 设备 使 用 
相应 的 协议 进行 数据 传输 。 其 中 串 行 SCSI 协 议 (SSP) 用 于 传输 SCSI 命 令 ; SCSI 管 理 协议 (SMP) 用 于 对 连接 设备 的 维护 和 管理 ; SATA 通 道 协议 (STP) 用 
于 SAS 和 SATA 之 间 数 据 的 传输 。 因 此 在 这 3 种 协议 的 配合 下 ，SAS 可 以 与 SATA 以 及 部 分 SCSI 设 备 无 颖 结合 。 


SAs 不 仅 在 接口 速度 上 得 到 显著 提升 (现在 主流 Ultra320SCSI 速 度 为 320MB/s， 而 SAS 才 网 起步 速 度 束 达 到 300MB/s， 未 来 会 达到 600MB/s 甚 至 更 
多 ) ， 而 且 由 于 采用 了 串 行 线 缆 ， 不 仅 可 以 实现 更 长 的 连接 距离 ， 还 能 够 提高 抗 干扰 能 力 ， 并 且 这 种 细 细 的 续费 还 可 以 显著 改善 机 箱 内 部 的 散热 情况 。 


SAs 目 前 的 不 足 主要 有 以 下 方面 。 


1) 硬盘 、 控 制 心 片 种 类 少 : 只 有 希捷、 迈 折 以 及 富士 通 等 为 数 不 多 的 硬盘 厂商 推出 了 SAs 接 口 硬盘 ， 品 种 太 少 ， 其 他 厂商 的 SAs 接 口 硬盘 多 数 处 在 产品 内 
部 测试 阶段 。 此 外 周边 的 SAs 控 制 器 心 片 或 者 一 些 SAs 转 接 卡 的 种 类 更 是 不 多 ， 多 数 集中 在 LS| 以 及 Adaptec 公 司 。 


2) 硬盘 价格 太 贵 : 比 起 同 容量 的 Ultra320SCSI 硬 盘 ，SAS 硬 盘 要 贵 一 售 还 多 。 一 直 居 高 不 下 的 价格 直接 影响 了 用 户 的 采购 数量 和 渠道 的 消化 数量 ， 而 无 
法 形成 大 批量 生产 的 SAs 硬 盘 ， 其 成 本 压力 又 会 反 过 来 促使 价格 无 法 下 降 。 如 果 用 户 想 要 做 个 简单 的 RAID 磁 盘 几 余 阵 询 ， 那 么 不 仅 需 要 购买 多 块 SAS 硬 盘 ， 还 
要 购买 昂贵 的 RAID 卡 ， 其 价格 基本 上 与 硬盘 相当 。 


3) 实际 传输 速度 变化 不 大 : SAS 硬 盘 的 接口 速度 并 不 代表 数据 传输 速度 ， 受 到 硬盘 机 械 结构 限制 ， 现 在 SAS 硬 盘 的 机 械 结构 与 SCSI 硬 盘 几 乎 一 样 。 目 前 
数据 传输 的 瓶颈 集中 在 由 硬盘 内 部 机 械 机 构 和 硬盘 存储 技术 、 磁 盘 转 速 所 决定 的 硬盘 内 部 数据 传输 速度 ， 也 就 是 80MB/s 左 右 ，SAS 硬 盘 的 性 能 提升 不 明显 。 


4) 用 户 追 求 成 就、 稳定 的 产品 : 从 现在 已 经 推出 的 产品 来 看 ，SAS 硬 盘 更 多 地 应 用 在 高 端 4 路 服务 器 上 ， 而 4 路 以 上 服务 器 用 户 并 非 一 味 追 求 高 速度 的 硬 
盘 接口 技术 ， 最 吸引 他 们 的 应 该 是 成 熟 、 称 定 的 硬件 产品 ， 虽 然 SAs 接 口服 务 器 和 3C3| 接 口 产品 在 速度 、 称 定性 上 差不多 ， 但 目前 的 技术 和 产品 都 还 不 够 成 


yoO 


不 过 随 着 Intel 等 主板 心 片 组 制造 商 、 和 希捷 等 硬盘 制造 商 以 及 众多 的 服务 器 制造 商 的 大 力 推动 ，SAs 相 天 产品 撤 术 会 逐步 成 熟 ， 价 格 也 会 逐步 滑落 ， 早 晚 都 
会 成 为 服务 器 硬盘 的 主流 接口 。 
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` 第 5 章 ”固态 存储 架构 

` 第 6 章 固态 存储 文件 系统 

“第 7 章 ”容错 与 写 平衡 


传统 大 容量 存储 设备 多 是 磁 记 录 设 备 ， 它 们 的 构造 非常 复杂 。 以 现在 广泛 使 用 的 硬盘 为 例 ， 硬 盘 大 致 由 盘 片 、 读 写 头 、 电 动机 、 底 座 、 电 路 板 等 几 大 项 组 
合 而 成 ， 通 过 盘 片 的 高 速 旋转 与 读 写 头 径 向 移动 的 精确 配合 来 读 写 数据 。 这 种 通过 机 械 运 动 读 取 数据 的 方式 大 大 制约 了 其 存 取 速 度 、 可 靠 性 和 使 用 寿命 ， 同 时 
也 被 遵循 摩尔 定律 飞速 发 展 的 处 理 器 远 远 地 抛 在 身后 ， 其 应 用 范围 受到 严重 的 限制 。 


不 同 于 磁带 、 机 械 硬盘 、 光 一 等 需要 依托 机 械 运动 实现 读 写 的 存储 技术 ， 国 态 存储 完全 基于 半导体 技术 ， 它 没有 转动 部 件 ， 彻 底 抛 弃 机 械 装 置 ， 突 破 传 统 
的 磁 记 录 设 备 的 性 能 瓶颈 ， 具 有 存储 密度 高 、 存 取 速 度 快 、 可 靠 性 高 、 功 耗 小 、 嗓 声 小 、 使 用 寿命 长 等 优点 。 在 传统 磁盘 存储 系统 性 能 停滞 不 前 的 今天 ， 固 态 
存储 作为 存储 领域 的 一 个 分 支 ， 经 历 多 年 的 研究 和 发 展 ， 终 于 脱颖而出 ， 为 存储 领域 带 来 一 场 革 命 性 的 变革 ， 成 为 突破 现 有 存储 性 能 瓶颈 的 希望 ， 被 认为 是 存 
储 领 域 的 未 来 新 星 。 


本 书 第 二 部 分 主要 介绍 固态 存储 的 原理 与 架构 ， 分 为 四 章 进行 介绍 。 
第 4 章 ， 固 态 存储 基本 知识 和 工作 原理 。 本 章 首先 对 固态 存储 技术 进行 了 概述 ， 随 后 详细 介绍 了 基于 NAND Flash 和 NOR Flash 的 固态 存储 原理 。 
第 5 章 ， 固 态 存储 架构 。 以 日 常 工作 、 生 活 中 广泛 使 用 的 国 态 硬盘 (SSD) 为 例 给 出 了 固态 存储 架构 并 详细 介绍 了 固态 存储 系统 的 各 大 基本 部 件 。 


第 6 章 ， 固 态 存 储 文件 系统 。 本 章 主要 针对 固态 存储 设备 中 广泛 使 用 的 浴 入 式 文件 系统 如 JFFS、YAFFS、UBIFS 以 及 exFAT 等 文件 系统 ， 从 内 存 结 构 、 文 件 
系统 持 载 、 运 行 原理 、 垃 圾 回收 等 方面 ， 详 细 介 绍 固 态 存储 文件 系统 的 原理 和 运行 机 制 。 


第 7 章 ， 容 错 与 写 平衡 。 本 章 主要 对 国 态 存储 设备 中 的 容错 与 平衡 技术 进行 了 介绍 ， 首 先 介绍 了 三 种 纠 错 码 即 汉 明 码 、BCH 码 以 及 里 德 -所 罗 门 码 的 操作 原 
理 ; 接着 介绍 了 固态 存储 的 平衡 机 制 ， 分 别 从 垃圾 回收 和 使 用 均衡 两 个 方面 介绍 其 作用 和 实现 原理 ;最 后 介绍 了 固态 存储 器 件 的 坏 块 管理 与 实现 。 


第 4 章 ”固态 仔 储 基本 知识 和 工作 原理 


固态 硬盘 、U 盘 、SD 卡 等 固态 存储 设备 是 近年 来 随 着 半导体 技术 的 快速 友 展 而 出 现 的 一 种 新 型 外 存储 设备 。 国 人 态 硬 盘 的 出 现 是 存储 领域 一 个 划时代 的 技术 
革新 ， 日 趋 成 为 目前 传统 硬盘 的 替代 品 。 固 仿 硬 盘 与 机 械 硬 盘 、 光 盘 等 存储 介质 不 同 ， 它 不 需要 读 写 头 、 不 需要 通过 介质 转动 来 读 写 数据 ，“ 固 态 ” 的 名 称 也 
因此 而 得 。 这 种 存储 器 由 半导体 心 请 阵列 组 成 ， 它 具有 速度 块 、 容 量 大 、 成 本 低 、 体 积 小 、 功 耗 低 等 优点 ， 而 且 工 作 时 无 噪声 ， 抗 振动 冲击 能 力 强 ， 数 据 安 全 
可 靠 性 高 ， 掉 电 后 可 保存 数据 ， 尤 其 能 够 在 恶 务 的 环境 下 正常 工作 ， 目 前 已 经 在 内 入 式 领域 得 到 广泛 应 用 ， 并 逐渐 占领 传统 硬盘 的 市 场 ， 成 为 目前 数据 存储 的 
主流 方向 。 随 着 消费 电子 的 不 断 深入 ， 各 种 市 有 固态 硬盘 的 电子 产品 大 量 普 及 ， 进 一 步 推动 了 固态 存储 技术 的 营 勃 友 展 和 市 场 占有 量 的 不 断 扩 大 。 


4.1 基本 知识 
传统 硬盘 由 于 机 械 架 构 的 存在 ， 不 能 像 CPU 那 样 通过 改进 制造 工艺 ， 在 一 定 的 空间 内 放置 更 多 的 晶体 管 以 提高 性 能 。 目 前 硬盘 的 主轴 转速 基本 没有 太 大 的 
提高 空间 了 ， 硬 盘 的 发 展 显然 要 落后 于 其 他 硬件 ， 并 逐渐 成 为 PC 中 的 瓶颈 之 一 ， 直 到 固态 硬盘 的 到 来 才 让 硬盘 真正 进入 高 速 发 展 的 时 代 。 


固态 硬盘 (Solid state Drive，SSD) 是 指 用 固态 电子 存储 心 片 阵列 制 成 的 硬盘 。SSD 的 构造 十 分 简单 ， 其 主体 其 实 束 是 一 块 PCB， 而 PCB 上 最 基本 的 部 
件 就 是 控制 心 片 、 缓 存心 片 和 用 于 存储 数据 的 内 存心 片 ( 部 分 低 端 型 号 并 没有 配置 缓存 心 片 ) 。 固 态 硬盘 在 接口 的 规范 和 定义 、 功 能 及 使 用 方法 上 与 普通 硬盘 
完全 相同 ， 在 产品 外 形 和 尺寸 上 也 完全 与 普通 硬盘 一 臻 。SSD 现 已 被 广泛 应 用 于 军事 、 和 车 载 、 工 控 、 视 频 监 控 、 网 络 监 控 、 网 络 终端 、 电 力 、 医 疗 、 航 空 、 导 


航 设备 等 领域 。 
4.1.1 半导体 仓储 器 概述 


上 文 提 到 固态 存储 是 指 以 半导体 存储 器 件 为 介质 进行 数据 存储 和 读 取 的 一 种 技术 ， 即 固态 存储 技术 是 半导体 存储 技术 中 的 一 种 。 为 使 读者 对 半导体 存储 器 
有 一 个 整体 认识 以 便 后 续 阅 读 ， 下 面 首先 回顾 一 下 半导体 存储 器 的 分 类 及 各 目的 特点 。 


图 4-1 为 半导体 存储 器 分 类 一 此 图 。 半 导体 存储 器 根据 其 存储 数据 方式 不 同 可 分 为 可 高 速写 入 和 读 取 的 RAM (Random Access Memory) 和 主要 进行 读 


取 用 的 ROM (Read Only Memory) 。RAM 包 括 切 断 电源 后 数据 就 会 消失 的 挥发 性 DRAM (Dynamic RAM) 和 SRAM (Static RAM) ， 还 有 可 以 保存 数据 
的 非 挥 友 性 FeRAM (Ferroelectric RAM) 、MRAM (Magnetic RAM) 。ROM 分 为 在 制造 过 程 中 写 入 数据 的 掩 模 ROM 和 成 为 产品 后 仍 可 以 写 入 的 
PROM (EPROM、EEPROM、 闪 存 ) 。 
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注 : EPROM、EEPROM、 闪存 属于 ROM 分 类 ， 但 可 以 重复 写 入 。 


图 4-1 半导体 存储 器 按 功能 的 分 类 
下 面 简单 介绍 一 下 各 种 RAM 和 ROM 的 结构 和 特点 。 
(1) DRAM 


DRAM 的 每 一 个 记忆 单元 (存储 单元 ) 由 1 个 晶体 管 和 1 个 电容 器 构成 ， 集 成 度 比较 好 ， 因 此 比特 单价 也 比较 低 ， 在 需要 大 容量 存 储 器 的 系统 中 航 广 泛 使 
用 。DRAM 用 电 和 葵 将 信息 存储 在 电容 器 内 ， 因 此 长 时 间 放 置 不 用 则 微小 的 漏电 电流 会 令 信息 丢 失 。 因 此 ， 需 要 定期 将 同一 信息 再 次 写 入 。 这 个 再 次 写 入 的 动作 
叫 作 更 新 。 此 外 ， 由 于 DRAM 是 一 直 工作 的 ， 因 此 称 为 动态 RAM。 


(2) SRAM 


SRAM 即 静态 RAM ， 它 也 由 晶体 管 组 成 。1 表 示 接 通 ，0 表 示 断 开 ， 并 且 状 态 会 保持 到 接收 了 一 个 改变 信号 为 止 。 这 些 晶体 管 不 需要 刷新 ， 但 停机 或 断 电 
时 它们 同 PRAM 一 样 会 丢 探 信息 。SRAM 的 速度 非 囊 快 ， 通 剃 能 以 20ns 或 更 快 的 速度 工作 。 一 个 DRAM 人 存储 单元 仪 需 一 个 晶体 管 和 一 个 小 电容 ， 而 每 个 SRAM 
单元 需要 4 ~ 6 个 晶体 管 和 其 他 零件 。 所 以 ， 除 了 价格 较 贵 外 ，SRAM 心 片 在 外 形 上 也 较 大 ， 与 DRAM 相 比 要 占用 更 多 的 空间 。 由 于 外 形 和 零件 上 的 差 
别 ，SRAM 和 DRAM 是 不 能 互 换 的 。SRAM 根 据 其 用 途 ， 分 为 低 耗 电量 且 存 取 时 间 较 慢 的 产品 ( 低 耗 电量 SRAM) 和 要 求 高 速 性 的 产品 (高 速 SRAM) 。 


(3) FeRAM 


FeRAM 的 结构 与 DRAM 相 同 ， 但 电容 部 分 是 用 强 导 电 体 材料 制 成 的 。DRAM 是 将 电荷 存储 在 电容 器 内 来 保存 数据 的 ， 而 FeRAM 利 用 强 导 电 体 材料 的 残留 
极 性 电压 为 正 或 负 来 保存 数据 ， 然 后 通过 读 取 其 状态 来 判断 是 1 还 是 0。 残 留 极 性 电压 在 电源 切断 后 也 能 保持 ， 因 此 是 非 挥发 性 的 。 


(4) MRAM 


MRAM 在 存储 器 件 中 属于 磁性 存储 体 。 被 磁化 的 元 件 上 面 的 布线 通电 时 ， 磁 场 方向 会 改变 布线 的 电阻 ， 并 利用 这 一 原理 来 保存 数据 。 电 压 在 电源 切断 后 


也 能 保持 ， 因 此 也 是 非 挥 友 性 的 。 
(5) 掩 模 ROM 


掩 腊 ROM 中 存储 的 信息 是 在 心 片 制造 过 程 中 束 固 化 好 了 的 ， 用 尸 只 能 选用 而 无 法 修改 原 存 信息 ， 故 又 称 为 固定 只 读 存 储 器 ROM。 通 常 ， 用 尸 可 将 自己 设 
计 好 的 程序 (信息 ) 委托 生产 厂家 在 生产 心 片 时 进行 固化 ( 掩 腊 ) ， 但 要 根据 用 户 程序 (信息 ) 制作 专用 的 掩 膜 模 具 ， 该 模具 成 本 较 高 ， 故 掩 腊 ROM 适 用 于 
批量 生产 的 产品 。 


(6) EPROM (Erasable Programmable ROM,， 可 擦 除 可 编程 ROM ) 


EPROM 的 用 户 使 用 写 入 沪 置 来 写 入 数据 ， 通 过 照射 紫外 线 能 擦 除数 据 。 因 此 ， 封 装 上 有 石英 玻璃 的 小 窗 。EPROM 可 以 用 于 产品 开发 时 来 调试 程序 和 数 
据 ， 但 闪存 实现 量 产后 其 使 命 也 已 告终 。 


(7) EEPROM (Electrical EPROM ， 可 电 擦 除 可 编程 ROM ) 


EEPROM 是 一 种 可 电 擦 除 可 编程 的 只 读 存 储 器 。 写 入 / 擦 除 以 字 忆 为 单位 ， 因 此 覆 苹 写 入 / 擦 除 时 间 较 长 。 而 且 ， 其 电路 复杂 且 难 以 大 容量 化 ， 因 此 主要 为 
数 K 到 数 百 K 位 的 产品 。 


(8) 闪存 (Flash Memory 或 Flash 存 储 器 ) 


内 存 是 一 种 可 在 线 多 次 擦 除 的 非 易 失 性 存储 器 ， 用 这 种 心 片 能 构成 理想 的 存储 设备 ， 在 不 加 电 情况 下 ， 信 息 也 可 保存 长 达 10 年 之 久 。 同 时 它 又 能 在 在 线 工 
作 情 况 下 进行 控 除 与 重 写 ， 标 准 擦 写 次 数 可 达到 十 万 次 。 而 且 其 集成 密度 高 、 单 位 成 本 低 ， 同 时 还 具有 体积 小 、 功 耗 低 、 抗震 性 强 等 优点 ， 比 传统 的 存储 设备 
更 能 承受 温度 的 变化 、 机 械 的 振动 和 冲击 ， 可 靠 性 更 局 ， 易 于 实现 高 速度 、 大 容量 、 低 功 耗 ， 日 起 成 为 存储 器 的 主流 介质 。 由 于 Flash 存 储 器 在 功 耗 、 成 本 、 
断 电 不 丢失 数据 等 方面 的 优势 明显 ， 且 随 着 制造 工艺 的 改善 ， 其 集成 度 已 远 高 于 DRAM。 因 此 除了 某 些 特殊 领域 外 ，Flash 和 存储 器 已 成 为 当今 固态 存储 器 的 主 


流 。 


4.1.2 ”固态 存储 器 的 分 类 


当前 ， 应 用 于 固态 存储 设备 的 存储 介质 主要 有 两 种 ， 一 种 基于 Flash， 另 外 一 种 基于 DRAM。 下 面 分 别 介绍 。 
(1) 基于 Flash 的 固态 存储 器 


在 1984 年 ， 东 芝 公 司 的 外 内 语 士 雁 首先 提出 了 快速 内 存 存 储 器 的 概念 。 基 于 闪存 的 固态 存储 设备 用 Flash 心 刻 作 为 存储 介质 ， 与 传统 电脑 内 存 不 同 ， 闪 存 
的 特点 是 非 易 失 性 ， 其 记录 速度 也 非常 快 。 基 于 闪存 的 固态 存储 设备 又 可 细 分 为 NOR 型 内 存 和 NAND 型 内 存 。 


` NOR 型 闪存 


Intel 是 世界 上 第 一 个 生产 内 存 并 将 其 投放 市 场 的 公司 。1988 年 ， 该 公司 推出 了 一 款 256Kb 内 存心 片 。 它 如 同 鞋 盒 一 样 大 小 ， 并 被 内 藤 于 一 个 录音 机 里 。 
后 来 ，Intel 发 明 的 这 类 闪存 被 统称 为 NOR 型 内 存 。 它 结合 EPROM 和 和 EEPROM 两 项 技术 ， 并 拥有 一 个 SRAM 接 口 。NOR 型 内 存 随机 存 取 速 度 快 ， 主 要 用 于 称 
为 固件 的 程序 存储 ,被 广泛 应 用 于 计算 机 、 打 印 机 等 信息 设备 ， 以 及 手机 、 数 字 电 视 、 游 戏 机 等 用 途 。 


" NAND 型 闪存 
NAND 型 内 存 由 日 立 公司 于 1989 年 研制 ， 并 被 认为 是 NOR 型 内 存 的 理想 替代 者 。NAND 型 | 内存 的 写 周期 比 NOR 型 内 存 短 90%， 它 的 保存 与 删除 处 理 的 速 
度 也 相对 较 快 。NAND 型 的 存储 单元 只 有 NOR 型 的 一 半 ， 在 更 小 的 存储 空间 中 NAND 型 获得 了 更 好 的 性 能 ， 这 使 得 NAND Flash 成 为 当前 主流 的 固态 存储 器 


件 。NAND Flash 现 已 被 广泛 应 用 于 作为 存储 设备 的 SD 存储 卡 、 小 型 内 存 (CF) 等 小 型 存储 卡 和 和 USB 闪存 盘 等 “桥梁 ”媒介 ， 以 及 数码 相机 、 音 乐 播 放 器 、 
音频 录音 机 、 固 态 硬 盘 等 需要 大 容量 存储 的 用 途 。NAND Flash 是 本 书 介绍 的 重点 。 


这 两 种 类 型 闪存 的 主要 区 别 在 于 : 


1) 访问 方式 。NOR 型 是 按 字 节 访问， 可 以 使 用 户 访 问 到 任意 位 置 ， 并 在 一 个 周期 内 读 出 数据 ， 而 且 存 放 在 Flash 里 的 程序 可 以 直接 执行 ， 在 嵌入 式 系 统 中 
常用 于 程序 代码 的 存储 。 而 NAND 型 是 捉 行 访问 的 ， 类 似 于 硬盘 的 存 取 方 式 ， 不 能 直接 执行 ， 需 要 先 把 程序 读 取 到 内 存 ， 然 后 再 从 内 存 中 运行 。 


2) 电压 驱动 。NOR 型 读 出 信息 单位 小 、 速 度 快 ， 可 适应 快速 灵活 的 工作 ， 但 它 需 采取 高 达 12V 的 外 部 电源 ， 使 其 在 便携 式 设备 的 应 用 中 受到 很 大 的 限 
制 。 而 NAND 型 目前 可 用 3.3V 的 电压 驱动 ， 并 比 NOR 型 内 存 获得 更 高 的 集成 度 。 


3) 容量 和 速度 。 与 NOR 型 相 比 ，NAND 型 的 优点 是 容量 大 ， 但 是 NAND 型 的 速度 较 慢 ， 这 是 因为 其 |/O 端 口 只 有 8 (或 者 16) 位 宽 ， 比 NOR 型 的 /O 端 口 
要 少 ， 要 完成 地 址 和 数据 的 传输 就 必须 让 这 些 信号 轮流 传送 ， 这 种 目 行 传输 比 NOR 型 芯片 的 并 行 传输 慢 很 多 。 但 NAND 型 采用 的 是 目 行 结构 方式 ， 可 以 达到 
极 高 的 存储 密度 ， 并 且 写 入 和 擦 除 的 速度 也 很 快 ， 价 格 也 相对 便宜 。 


4) 坏 块 。 由 于 NAND 型 本 身 工艺 的 原因 ， 其 人 存储 器 在 出 三 时 一 般 都 有 一 定 的 坏 块 ， 并 且 这 些 坏 块 是 随机 分 布 的 ， 而 且 在 使 用 过 程 中 也 会 产生 一 定 的 坏 
块 。 因 此 使 用 时 必须 对 其 坏 块 进行 管理 ， 创 建 系统 坏 块 表 ， 并 在 使 用 中 将 出 现 的 坏 块 信号 添加 到 坏 块 表 中 。 


NAND 型 的 存储 和 传输 是 以 页 和 块 为 单位 的 ， 相 对 适合 大 块 数据 的 连续 传输 ， 主 要 用 于 数据 的 存储 和 文件 存储 ， 而 且 其 接口 定义 和 规范 、 功 能 以 及 使 用 方 
法 都 与 传统 的 硬盘 大 体 相同 ， 可 作为 传统 硬盘 的 替代 存储 设备 。 选 择 使 用 NAND Flash 作 为 固态 硬盘 的 存储 介质 是 实现 大 容量 的 数据 存储 技术 的 理想 方案 ,也 
是 当前 的 研究 热点 。 


(2) 基于 DRAM 的 固态 存储 器 


采用 DRAM 作 为 存储 介质 ， 是 仿效 传统 硬盘 的 设计 思路 。 由 于 DRAM 支 持 DDR 技 术 ， 所 以 使 用 DRAM 的 固态 电子 盘 具有 数据 存储 快 、 数 据 安全 性 能 高 、 
使 用 寿命 长 等 特点 ， 并 且 可 利用 绝 大 部 分 操作 系统 的 文件 系统 工具 进行 卷 设置 和 管理 ， 它 还 提供 工业 标准 的 PCI 和 FC 接 口 用 于 连接 主机 或 者 服务 器 ， 因 此 在 工 
业 领 域 有 一 定 的 使 用 范围 。 及 用 DRAM 作 为 存储 介质 的 固态 硬盘 是 一 种 高 性 能 的 存储 器 ， 与 内 存 相 比 ， 其 数据 读 取 较 快 ， 使 用 寿命 比较 长 ， 如 果 保 护 措施 采取 
恰当 ， 采 用 DRAM 人 质 的 硬盘 的 正常 使 用 寿命 在 10 年 以 上 。 


但 是 基于 DRAM 的 固态 盘 也 有 其 致命 的 缺点 ， 即 其 成 本 较 高 ， 设 计 也 相对 复杂 ， 而 且 由 于 是 挤 电 易 失 介 质 ， 它 还 需要 独立 电源 来 保护 数据 安全 ， 人 否则 会 造 
成 数据 的 丢失 。 另 外 在 任何 时 候 的 能 耗 都 高 于 传统 硬盘 ， 所 以 目前 其 应 用 范围 相对 较 窄 。 


4.1.3 ”固态 存储 器 的 特点 


固态 存储 器 与 机 械 硬 盘 相 比 具有 许多 独特 的 优势 ， 近 年 来 友 展 迅速 ， 逐 渐 成 为 主流 存储 介质 ， 广 泛 应 用 于 电子 产品 之 中 ， 其 主要 优点 如 下 : 
(1) 速度 快 


固态 存储 器 与 传统 机 械 硬 盘 相 比 ， 由 于 它 没 有 磁头 ， 采 用 快速 随机 读 取 ， 延 迟 极 低 ， 在 系统 局 动 及 软件 运行 方面 速度 非常 快 ， 其 找到 数据 的 时 间 几 乎 等 于 
0， 相 对 传统 机 械 硬 盘 的 寻 道 时 间 来 说 要 快 多 了 。 


(2) 耐用 防震 


因为 全 部 采用 了 闪存 心 片 ， 所 以 固态 存储 器 内 部 不 存在 任何 机 械 部 件 ， 这 样 即使 在 高 速 移动 甚至 伴随 翻转 倾斜 的 情况 下 也 不 会 影响 到 正常 使 用 ， 将 笔记 本 
电脑 友 生意 外 掉 落 或 与 硬 物 碰撞 时 数据 丢失 的 可 能 性 降 到 最 小 。 


(3) 无 噪声 


固态 存储 器 工作 时 非常 安静 ， 没 有 任何 噪声 产生 。 这 得 益 于 无 机 械 部 件 及 闪存 心 片 较 小 的 友 热量 、 散 热 快 等 特点 ， 固 仿 存 储 器 因为 没有 机 械 电 机 和 风扇 ， 
工作 噪声 值 为 0 分 贝 。 


(4) 重量 轻 


固态 存储 器 比 常规 1.8 严 寸 硬盘 重量 轻 20 ~ 30 克 ， 可 干 万 别 小 看 这 些 重 量 ， 在 笔记 本 电脑 、 卫 星 定位 仪 等 随身 移动 产品 上 ， 更 小 的 重量 有 利于 便携 。 此 
外 ， 重 量 的 减轻 也 使 得 笔记 本 搭载 多 块 固 态 存 储 器 成 为 可 能 。 


目前 固态 存储 器 在 接口 规 污 和 定义 、 功 能 及 使 用 方法 上 与 普通 硬盘 相同 ， 在 产品 外 形 和 尺寸 上 也 与 普通 硬盘 一 致 ， 且 其 心 片 的 工作 温度 沁 围 很 宽 (- 
40"C~85"C) 。 当 然 ， 固 态 存 储 介质 也 存在 一 些 特殊 的 物理 限制 ， 即 不 可 原 位 更 新 (out-of-place update) 、 不 能 重复 写 、 擦 除 寿命 有 限 等 。 这 些 特殊 的 物 
理 限制 导致 现 有 的 文件 系统 无 法 直接 应 用 于 固态 存储 介质 ， 需 要 特殊 的 转换 技术 以 屏 敞 这些 限 制 ， 后 续 我 们 将 会 详细 介绍 。 


4.2 ”Flash 人 存储 介质 工作 原理 


Flash 都 是 使 用 浮 栅 场 效应 管 (Floating Gate FET) 作为 基本 存储 单元 来 存储 数据 的 ， 浮 栅 场 效应 管 共有 4 个 端 电极 ， 分 别 为 源 极 (Source，S) 、 漏 极 
(Drain，D) 、 控 制 栅 极 (Control Gate) 和 浮 置 栅 极 (Floating Gate) ， 前 3 个 端 电极 的 作用 与 普通 MOSFET 是 一 样 的 ， 区 别 仪 在 于 浮 置 栅 极 ，Flash 残 是 
利用 浮 置 栅 极 是 否 存 储 电 荷 来 表征 数字 “0” 和 “1” 的 。 当 向 浮 置 栅 极 注入 电荷 后 ，D 极 和 S 极 之 间 存 在 导电 沟 道 ， 从 D 极 读 到 “0”; 当 浮 置 栅 极 中 没有 电荷 
时 ，D 极 和 S 极 间 没 有 导电 沟 道 ， 从 D 极 读 到 “1”。 


从 前 面 的 介绍 我 们 知道 ，Flash 又 分 为 两 种 ,分 别 是 NAND Flash 与 NOR Flash， 二 者 在 工作 原理 、 读 写 效 率 、 可 靠 性 等 方面 均 有 明显 差异 ， 其 使 用 范围 也 
不 同 。 其 特点 对 比如 表 4-1 所 示 。 


表 4-1 NAND Flash 与 NOR Flash 对 比 


连接 方式 存储 单元 之 间 并 联 存储 单元 之 间 串 联 
读 性 能 较 NOR Flash 更 慢 
写 性 能 较 NOR Flash 更 快 
扩 除 性 能 较 NOR Flash 更 忆 








可 靠 性 可 徘 性 高 可 靠 性 相对 较 低 
容量 密度 低 ， 容 量 小 密度 高 ， 容 量 大 





到 
适用 范围 适用 于 存储 代码 适用 于 存储 数据 


NOR Flash 和 存储 单元 之 间 是 并 联 的 ， 其 密度 低 ， 容 量 也 相对 较 小 ， 但 其 读 取 速度 快 、 可 靠 性 高 ， 使 得 其 非常 适用 于 存储 代码 。NAND Flash 存 储 单元 之 间 
是 串联 的 ， 其 密度 高 、 容 量 大 、 写 入 速度 快 ， 适 合 于 存储 数据 ， 在 现代 存储 领域 友 展 迅 猛 ， 并 成 为 主流 存储 介质 。 


4.2.1 NOR Flash 


NOR Flash，NOR 融 是 “ 非 或 ”的 意思 。 大 家 目 然 会 想到 ， 位 续 一 定 不 是 串联 的 而 是 并 联 的 ， 否 则 不 能 够 产生 “或 ”的 逻辑 。 实 际 上 ， 在 NOR Flash 中 同 
样 是 一 “ 串 ” 单 元 (Cell) ， 但 是 这 串 Cell 中 的 每 个 Cell 均 引出 独立 的 位 线 ， 然 后 并 联 到 一 根 总 位 线 上 。 另 外 一 点 很 重要 的 是 ， 每 个 Cell 的 S 极 和 D 极 之 间 昌 然 
物理 上 串联 ， 但 是 电路 上 不 是 串联 的 ， 而 是 各 自 有 各 自 的 接地 端 ， 也 就 是 每 个 Cell 的 S 极 和 D 极 之 间 的 通 断 不 再 取决 于 其 他 Cell 的 S 极 和 D 极 的 通 断 了 ， 只 取决 于 


自身， 其 结构 如 图 4-2 所 示 。 
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图 4-2 ”NOR Flash 结 构 


以 上 两 点 共同 组 成 了 “或 ”的 关系 ， 同 时 每 个 Cell 具 有 完全 的 独立 性 ， 只 要 通过 控制 对 应 的 接地 端 ， 将 未 被 选中 的 Cell 的 地 线 全 部 断 开 ， 这 样 它们 的 S 极 和 
D 极 之 间 将 永远 无 法 导 通 (逻辑 0 状态 ) ， 由 于 每 个 Cell 的 位 线 并 联 到 轧 位 线 ， 忆 位 线 的 信号 只 取决 于 选中 的 Cell 的 导 通 与 否 ， 对 于 被 选中 的 Cell; NOT{ (“地 
线 接 通 ”AND “FG 是 否 有 电 ”) OR“ 未 被 选中 Cell 的 输出 ”}= “ 忆 位 线 的 1/0 值 ”。 这 就 是 NOR 非 与 门 的 逻辑 。 


由 于 NOR Flash 多 了 很 多 导线 ,包括 独立 地 线 (通过 地 址 译 码 器 与 Cell 的 地 线 相连 ) 和 多 余 的 位 线 ， 导 致 面积 增 大 。 其 优点 是 Cell 可 以 独立 寻 址 ， 可 以 直 
接 用 地 址 线 寻 址 ， 读 取 效 率 比 NAND Flash 要 高 ， 所 以 可 以 直接 当 作 RAM 用 ， 但 是 写 入 时 由 于 擦 除 效率 比 NAND Flash 低 ， 所 以 不 利于 写 频繁 的 应 用 场景 。 


1.NOR Flash 存 储 单元 结构 


NOR Flash 存 储 单元 的 结构 原理 见 图 4-3。 从 图 中 可 以 看 出 ,每 条 位 线 (Bit Line) 下 的 基本 存储 单元 是 并 联 的 ， 当 某 条 字 线 (Word Line) 被 选中 后 ,区 
可 以 实现 对 该 Word 的 读 取 ， 也 残 是 可 以 实现 位 读 取 ( 即 Random Access， 随 机 访问 ) ， 且 具有 较 高 的 读 取 速率 。 图 4-3 是 一 个 3x8 位 的 NOR Flash 的 原理 结 
构图 ， 图 4-4 是 沿 字 续 切面 的 剖面 图 ， 展 示 了 NOR Flash 的 硅 切 面 示意 图 ， 这 种 并 联结 构 决定 了 NOR Flash 的 很 多 物理 存储 特性 。 


NOR Flash 基 本 存储 单元 是 并 联 的 ， 这 种 并 联结 构 决 定 了 金属 导线 占用 很 大 的 面积 ， 因 此 NOR Flash 的 存储 密度 较 低 ， 无 法 适用 于 需要 大 容量 存储 的 应 用 
场合 。 因 此 ，NOR Flash 主 要 适合 存储 代码 ， 并 不 适合 存储 数据 。 


其 次 ， 对 于 信号 读 的 速度 来 说 ，NOR Flash 读 效率 较 高 ， 其 比 NAND Flash 快 。 由 于 NOR Flash 芝 有 SRAM 接 口 ， 有 足够 的 地 址 引 脚 来 寻 址 ， 可 以 很 容易 
地 存 取 其 内 部 的 每 一 字 节 。 其 存储 单元 的 并 联结 构 决 定 了 NOR Flash 的 存储 单元 可 独立 寻 址 ， 并 随机 访问 ， 读 取 效 率 高 。 因 此 非常 适合 存储 代码 ， 程 序 可 以 直 
接 在 NOR Flash 中 运行 ( 即 具有 RAM 的 特性 ) 。 


BitO Bit1 Bit2 Bit3 Bit4 Bit5 Bit6 Bit7 
Word 1 


word: Te 


图 4-3 NOR Flash 存 储 单 元 结构 





图 4-4 NOR Flash 的 切面 图 


对 于 写 操作 ，NOR Flash 写 入 采用 了 热电 子 注 入 方式 ， 效 率 较 低 ， 因 此 NOR Flash 写 入 速率 较 低 ， 不 适用 于 频繁 擦 除 / 写 入 场合 。Flash 器 件 的 写 入 操作 均 
只 能 在 空 或 已 擦 除 的 单元 内 进行 ， 在 大 多 数 情 况 下 ， 人 在 进行 写 入 操作 之 前 必须 先 执行 擦 除 。NAND Flash 器 件 执 行 擦 除 操作 十 分 简单 ， 而 NOR Flash 则 要 求 在 
进行 擦 除 前 先 要 将 目标 块 内 所 有 的 位 都 写 为 0。 所 以 NOR Flash 写 入 速度 要 比 NAND Flash 慢 ， 写 效率 较 低 。 


2. 基 本 操作 
任何 存储 介质 都 有 三 种 基本 操作 ， 即 读 、 写 和 擦 除 ， 下 面 分 别 介绍 NOR Flash 这 三 种 操作 的 原理 。 
(1) 读 操作 


读 操 作 (read) 一 般 是 以 一 个 字 节 或 一 个 字 为 单位 ， 是 这 三 种 操作 中 比较 简单 的 。 我 们 就 以 一 个 存储 单元 为 例 ， 图 4-5 为 NOR Flash 读 操作 示意 图 ， 一 
字 线 上 的 所 有 存储 单元 就 是 一 个 字 节 或 者 一 个 字 ， 也 就 是 有 8 根 或 者 16 根 位 线 连 着 8 个 或 者 16 个 电流 感应 放大 器 (sense amplifier) 同 在 一 条 字 线 上 。 由 于 
Flash 的 读 操作 是 在 控制 栅 极 (CG) 上 施加 一 个 电压 ， 漏 极 (Drain) 加 上 一 个 小 的 正 电压 ，Drain 上 就 会 流入 电流 ， 通 过 比较 Drain 上 电流 和 参考 电流 的 大 小 
来 判断 存储 单元 里 存储 的 是 “1” 还 是 “0”。 如 果 这 个 存储 单元 是 一 个 被 写 入 过 的 ， 就 没有 电流 通过 ， 那 就 是 高 的 阔 值 电压 ， 相 当 于 逻辑 “0”; 相反 ， 如 果 
这 个 存储 单元 是 被 擦 除 过 的 ， 则 是 低 的 阔 值 电压 ， 就 有 电流 流 过 ， 相 当 于 逻辑 “1” ， 这 个 存储 器 就 是 打开 的 ， 它 的 电流 就 会 被 电流 感应 放大 器 获得 ， 然 后 将 
这 个 读 到 的 数据 通过 数据 线 输 出 ， 这 样 读 的 操作 就 完成 了 。 另 外 一 个 需要 考虑 的 问题 就 是 每 个 阔 值 电压 的 水 平 (Level) 分 布 ， 它 们 必须 要 有 一 定 的 距离 ， 送 
样 读 存 储 器 信息 的 时 候 才 有 足够 的 容 限 。 如 果 两 个 水 平 之 间 过 于 接近 的 话 ， 由 于 噪声 等 原因 影响 ， 则 很 有 可 能 会 将 这 个 存储 单元 的 立 值 电压 (Vt) 读 成 另外 一 
个 水 平 的 冰 值 电压 ， 这 样 的 话 读 出 来 的 数据 就 会 出 错 。 如 果 芯 片 放置 时 间 太 久 的 话 ， 也 会 因为 受到 各 种 冷 热 环境 等 影响 ，Cell 的 电压 也 有 可 能 会 出 现 微小 的 变 
化 ， 此 时 若 两 个 水 平 过 于 接近 的 话 ， 变 化 的 Cell 可 能 会 从 一 个 水 平 落 入 另外 一 个 水 平 的 范围 ， 送 样 的 数据 同样 也 会 发 生 错误 。 如 图 4-6 所 示 是 NOR Flash 读 操 
作 电 压 ， 读 所 用 的 电压 总 是 在 两 个 水 平 之 间 没 有 电势 分 布 的 地 方 ， 这 样 才能 保证 读 出 的 数据 是 正确 的 。 
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图 4-5 NOR Flash 读 操作 
2 本 吉 作 


写 入 操作 与 读 操 作 一 样 ， 一 般 也 是 以 一 个 字 节 或 一 个 字 来 执行 。NOR Flash 写 操作 包括 两 种 操作 ， 一 种 是 写 入 操作 (Program) ， 另 一 种 是 擦 除 操 作 
(erase) 。NOR Flash 写 入 操作 是 采用 热电 子 注 入 (CHE) 的 方式 ， 靠 近 漏 极 的 电子 济 被 控制 栅 极 的 电压 吸引 到 了 浮 置 栅 极 里 。 如 图 4- 7 所 示 是 NOR Flash 写 
入 操作 的 电压 ， 漏 极 加 上 电压 ， 使 得 电子 加 速 向 漏 极 方 向 运动 ， 成 为 热电 子 ， 同 时 控制 栅 极 上 加 上 高 电压 ， 热 电子 融会 通过 浮 置 栅 极 下 的 绝缘 层 (Tox) 进入 
浮 置 栅 极 。 
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图 4-6 ”NOR Flash 读 操作 电压 
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图 4-7 NOR Flash 写 操作 示意 图 


写 入 操作 原理 很 简单 ， 但 实际 上 它 是 一 个 比较 复杂 的 流程 。 它 一 般 都 要 经 过 “ 擦 除 - 写 入 ”两 个 操作 过 程 。 如 果 需 要 对 NOR Flash 存 储 器 的 某 一 个 单元 进 
行 写 入 操作 ， 首 先 一 定 要 对 这 个 存储 单元 所 在 的 区 块 (Block) 进行 擦 除 操作 。 擦 除 操作 完成 后 ， 即 整个 区 块 的 数据 内 容 都 被 清空 后 ， 才 能 对 存储 单元 所 在 的 
页 面 (Page) 进行 写 入 操作 ， 需 要 一 次 写 入 整个 页 面 的 全 部 数据 内 容 ， 最 后 操作 成 功 后 还 要 对 数据 正确 性 进行 校 验 。 


以 单个 存储 单元 为 例 ， 如 图 4-8 所 示 NOR Flash 写 操作 。 当 要 进行 写 入 操作 的 时 候 ， 那 束 相 当 于 给 这 个 存储 单元 输入 逻辑 “0”， 字 线 融会 被 激活 ， 此 时 位 
线 上 也 被 加 上 电压 ， 这 个 时 候 允 许 通 道 热 载 流 子 进入 浮 置 栅 极 里 面 ， 使 得 达到 写 入 的 存储 单元 阅 值 电压 (6~ 8V) ， 如 图 4-9 所 示 实 线 所 指 的 范围 。 它 还 需要 
验证 一 下 是 否 已 经 被 正确 写 入 。 验 证 主要 是 通过 读 存 储 单元 是 人 否 已 经 达到 了 写 操作 的 阅 值 电压 ， 并 与 寄存 器 存储 的 数据 比较 ， 如 果 两 个 数据 一 致 ， 说 明 这 个 存 
储 单 元 已 经 写 入 了 正确 的 值 。 如 果 数 据 不 一 致 ， 会 有 另 一 个 写 入 脉冲 加 到 这 个 存储 器 单元 里 面 (控制 栅 极 和 漏 极 ) ， 直 到 数据 真正 写 入 ， 或 者 经 过 大 量 的 写 入 
脉 中 ， 并 且 超 过 了 所 规定 的 写 入 脉冲 的 次 数 ， 那 就 认为 这 个 存储 单元 写 操作 失效 。 
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图 4-8 NOR Flash 写 操作 
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图 4-9 NOR Flash 写 操作 赋值 电压 


如 果 漏 极 (Drain) 和 控制 栅 极 (Control Gate) 的 电压 都 补给 定 ， 并 且 在 固定 的 时 间 里 间 隅 地 加 电压 〈 即 加 脉冲 ) ， 那 么 这 个 存储 单元 的 电压 Vt 会 先 随 
着 时 间 线 性 增长 ， 然 后 增长 变 慢 ， 最 后 进入 饱和 区 域 ， 即 电压 不 再 变化 ， 这 与 两 个 因素 有 关 : @Drain 极 电压 的 大 小 决定 了 线性 区 域 的 斜率 ， 即 Drain 极 的 电压 
越 高 ， 电 压 升 得 越 快 ，@ 控 制 栅 极 电压 的 大 小 决定 饱和 区 的 饱和 电压 ， 即 无 论 再 加 多 少 脉冲 ， 也 没有 办 法 使 电压 无 限制 地 增加 ， 因 为 受到 了 控制 栅 极 电压 的 限 


制 。 从 存储 单元 的 电压 来 看 ， 如 果 在 线性 区 域 完成 写 操作 的 话 ， 电 压 的 分 布 会 受到 很 多 因素 的 影响 ， 如 施加 在 Drain 上 电压 的 变化 和 工艺 的 变化 等 ， 结 果 都 会 
使 电压 的 最 终 分 布 难以 确定 。 所 以 要 精确 控制 电压 的 大 小 ， 让 编程 (Program) 的 脉冲 在 饱和 区 才能 停 下 来 ， 且 用 控制 栅 极 的 电压 来 控制 最 终 的 Vt 大 小 。 


(3) 探 除 操作 


擦 除 操作 是 按 一 个 block 或 几 个 block 来 操作 的 。NOR Flash 的 擦 除 使 用 隧 穿 (FN Tunneling) 的 方式 ， 目 前 大 多 数 采 用 的 是 阱 (Well) 擦 除 的 方法 ， 对 
于 阱 按 除 ， 按 除 时 在 Control Gate 上 加 负电 压 ， 在 阱 上 加 正 电 压 ， 而 Source 极 和 Drain 极 则 悬空 ， 如 图 4-10 所 示 NOR Flash 按 除 操作 电压 ， 由 于 Control Gate 
和 阱 有 很 大 的 电压 差 ， 浮 置 栅 极 上 的 电子 穿 过 Tox 被 拉 下 ， 电 子 减少 了 ， 则 电势 也 变 低 了 。 


擦 除 操作 更 加 复杂 ， 主 要 有 下 面 几 个 原因 。 首 先 ， 它 的 操作 是 针对 整个 存储 阵列 ， 所 以 它 的 验证 程式 要 求 一 个 区 块 (Block) 里 的 存储 单元 都 要 读 。 另 外 
更 重要 的 是 还 要 检查 存储 单元 的 立 值 电压 是 否 过 低 。 如 图 4-11 所 示 ， 图 上 用 圆圈 标示 的 那 一 部 分 束 是 过 擦 除 (over erase) 所 导致 的 ， 如 果 电 压 这 样 低 的 话 ， 
还 需要 提高 存储 单元 的 靖 值 电压 ， 控 制 在 存储 单元 探 除 国 值 的 电压 学 围 乙 内 。 在 一 个 区 块 内 存储 单元 的 国 值 电压 的 分 布 也 是 衡量 这 个 必 片 好 和 坏 的 标准 。 当 擦 
除 程式 被 激活 时 ， 整 个 区 块 的 存储 单元 都 会 先进 行 写 操作 成 为 逻辑 “0”， 疹 值 电 压 很 高 ， 一 般 情 况 下 这 个 时 候 残 可 以 开始 把 这 个 区 块 探 除 成 “1”。 它 允许 更 
多 单一 擦 除 国 值 电压 的 分 布 ， 因 为 所 有 的 靖 值 电压 都 属于 同 - 个 范围 乙 内 。 对 一 个 单独 区 块 进行 探 除 操作 时 ， 有 个 高 电场 在 衬 底 和 控制 栅 上 ， 使 用 FN 方 式 让 
电流 从 浮 栅 进 入 衬 底 。 然 后 像 写 入 操作 一 样 ， 通 过 读 的 方式 去 验证 是 不 是 已 经 被 擦 除 掉 了 ， 如 果 没 有 则 继续 擦 除 ， 直 到 擦 除 到 要 求 的 擦 除 阅 值 电压 的 荡 围 之 
内 。 如 果 擦 除 太 过 了 的 话 ， 还 需要 使 用 软 写 入 (soft program) 的 方式 把 它 调 回 到 正常 的 范围 内 。 
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图 4-10 NOR Flash 擦 除 操 作 电 压 





图 4-11 NOR Flash 过 擦 除 
4.2.2 NAND Flash 


NAND Flash 是 电 可 擦 除 可 编程 只 读 存储 器 (Electrically Erasable Programmable Read-only Memory，EEPROM) 的 一 种 ， 它 同 NOR Flash 一 样 都 是 
典型 的 非 易 失 性 的 Flash 存 储 器 件 。 


1.NAND Flash 存 储 单元 物理 组 成 


如 图 4-12 所 示 ，NAND Flash 人 存储 单元 结构 的 典型 特征 是 具有 两 个 多 晶 硅 栅 极 。 其 中 一 个 有 外 接 电路 连接 ， 称 为 控制 顶 极 ， 也 融 是 一 般 意 义 上 的 栅 极 ， 控 
制 栅 极 上 的 连 线 称 为 字 线 。 另 外 还 有 一 个 没有 外 引 续 的 栅 极 ， 这 个 栅 极 被 完全 包 囊 在 一 层 氧化 物 介 质 层 里 面 ， 因 为 这 个 特殊 的 栅 极 是 浮 空 的 ， 所 以 称 为 浮 置 栅 
极 。 
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图 4-12 NAND Flash 存 储 单 元 结构 


浮 置 栅 极 是 真正 存储 数据 的 单元 。 数 据 在 Flash 内 存单 元 中 是 以 电 和 葆 形式 存储 的 。 存 储 电荷 的 多 少 取决 于 图 4-12 中 的 控制 栅 所 被 施加 的 电压 ， 其 控制 是 向 
存储 单元 中 冲 入 电 和 葵 还 是 使 其 释放 电 和 葵 。 


底层 的 硅 基底 是 轻 挫 杂 的 缺少 电子 型 的 P 型 半导体 。P 型 半导体 (P 为 Positive 的 首 字 母 ， 由 于 空 穴 带 正 电 而 得 此 名 ) : 在 挫 入 少量 杂质 硼 元 素 (或 钢 元 
素 ) 的 硅 晶体 (或 钞 晶体 ) 中 ， 由 于 半导体 原子 (如 硅 原 子 ) 被 杂质 原子 取代 ， 硼 原子 的 三 个 外 层 电子 与 周围 的 半导体 原子 形成 共 价 键 的 时 候 ， 会 产生 一 
个 “空余 ”， 这 个 空 从 可 能 吸引 束缚 电子 来 “填充 ”， 使 得 大 原子 成 为 市 负电 的 离子 。 这 样 ， 这 类 半导体 由 于 含有 较 高 浓度 的 “ 空 从” (相当 于 正 电 倚 ) ， 成 
为 能 够 导电 的 物质 。 


源 极 和 漏 极 是 高 掺 杂 的 富 含 电子 型 的 N 型 半导体 。 漏 极 上 的 连 线 称 为 位 线 。N 型 半导体 (NN 为 Negative 的 首 字母 ， 由 于 电子 带 负 电 而 得 此 名 ) : 在 掺 入 少 
量 杂 质 磷 元 素 (或 饥 元 素 ) 的 硅 晶体 (或 镭 晶 体 ) 中 ， 由 于 半导体 原子 (如 硅 原 子 ) 被 杂质 原子 取代 ， 磷 原子 的 五 个 外 层 电子 的 其 中 四 个 与 周围 的 半导体 原子 
形成 共 价 键 ,多 出 的 一 个 电子 几乎 不 受 束 缚 ， 容 易 成 为 自由 电子 。 于 是 ，N 型 半导体 束 成 为 含 电 子 浓度 较 高 的 半导体 ， 其 导电 性 主要 是 因为 自由 电子 导电 。 


包 诸 在 浮 置 栅 极 周围 的 氧化 层 ， 以 及 氮 化 物 组 成 的 浮 置 栅 极 ， 构 成 了 氧化 物 - 氮 化 物 -氧化 物 (Oxide-Nitride-Oxide，ONO) 这 种 特殊 结构 ， 保 证 了 
NAND Flash 存 储 单元 浮 置 栅 极 中 电荷 的 非 易 失 性 (nonvolatility) ， 即 NAND Flash 存 储 数据 的 非 易 失 性 。 通 常 浮 置 栅 极 与 晶体 管 通道 之 间 的 氧化 层 被 称 为 
隧道 氧化 (tunnel oxide) 层 。 一 般 浮 置 栅 极 上 层 的 氧化 层 厚 度 小 于 20nm， 而 控制 栅 极 氧化 层 的 厚度 小 于 10nm。 


NAND Flash 的 工作 原理 与 场 效应 管 (MOSFET) 相同 ， 主 要 是 利用 电场 效应 控制 源 极 与 漏 极 之 间 的 通 断 ， 从 而 实现 数据 的 人 存 取 ， 区 别 是 场 效 应 管 为 单 栅 
极 结构 ( 即 只 有 一 个 控制 栅 极 ) ， 而 NAND Flash 为 双 栅 极 结构 ， 在 控制 栅 极 与 硅 衬 底 之 间 增 加 了 一 个 浮 置 栅 极 。 浮 置 栅 极 的 上 下 两 层 是 氧化 物 材 料 ， 中 间 则 
包 时 着 氮 化 物 。 氮 化 物 用 来 存储 电 衔 的 电 和 葵 势 阱 ， 即 存储 数据 ， 而 外 部 的 氧化 层 则 确保 了 电 和 葆 能 长 期 存储 在 氮 化 物 中 。 为 了 避免 友 生 击 穿 情况 ， 上 下 两 层 氧化 
物 的 厚度 大 于 50 埃 。 


2.NAND Flash 和 存储 单元 组 织 结构 


为 了 缩短 NAND Flash 存 取 时 间 ， 提 高 单位 面积 中 存储 单元 的 存储 密度 ，NAND Flash 并 不 是 对 每 个 单元 进行 单独 的 存 取 操作 ， 而 是 对 一 定数 量 的 存 取 单 
元 进行 集体 操作 。NAND Flash 将 各 个 存储 单元 组 织 成 为 阵列 的 形式 。NAND Flash 的 存储 单元 采用 串 行 结 构 ， 这 种 结构 的 优点 是 适合 作为 大 容量 存储 器 。 


如 图 4-13 所 示 ，NAND Flash 将 一 串 存 储 单元 的 控制 栅 极 都 串联 在 一 条 字 线 上 ， 这 一 串 和 存储 单元 称 为 一 页 (page) ， 即 同一 页 上 的 所 有 存储 单元 共享 一 





图 4-13 NAND Flash 的 内 部 结构 


NAND Flash 中 相 邻 的 多 个 页 的 人 存储 单元 组 成 块 (block) 。NAND Flash 的 一 个 块 内 所 有 页 中 处 在 相同 位 置 且 相 邻 存储 单元 的 漏 极 和 源 极 头 尾 相连 ， 最 高 
端的 漏 极 接 位 线 ， 最 低 端 的 源 极 与 公共 源 极 线 相 连 。 所 有 的 位 线 组 成 属于 该 块 的 |/O 线 ， 即 一 个 块 共 享 一 条 总 位 线 ， 如 图 4-14 所 示 。 
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图 4-14 NAND Flash 存 储 单元 结构 


NAND Flash 每 一 页 的 存储 单元 分 为 数据 存储 区 (data area) 和 扩展 区 (spare area 或 者 out-of-bound area，OOB 区 ) 。 前 者 用 于 存储 用 户 数 据 ， 而 
后 者 用 于 存放 该 页 的 描述 信息 ， 如 纠 错 码 (Error-Correcting-Code，ECC) 、 坏 块 标 记 、 地 址 映射 信息 和 文件 系统 相 天 的 数据 。 数 据 仓储 区 和 扩展 区 的 存储 
单元 在 物理 结构 上 并 无 差别 。 


通常 来 讲 ， 扩 展区 的 每 16 字 节 摘 述 主 存储 区 的 512 字 节 。 第 一 个 16 字 节 用 于 描述 主 存 储 区 的 第 一 个 512 字 节 ， 第 二 个 16 字 节 用 于 摘 述 主 存储 区 的 第 二 个 
512 字 节 ， 以 此 类 推 。 


NAND Flash 根 据 页 和 块 的 大 小 ， 可 以 分 为 small page 型 和 large page 型 。 典 型 的 块 、 页 的 大 小 如 表 4-2 所 示 ， 还 有 其 他 的 更 大 page 的 NAND Flash 类 
型 。 


表 4-2 NAND Flash 块 页 大 小 


类 型 每 一 页 的 大 小 页 数 / 块 每 块 大 小 


small page ($512+16 ) 字 节 ( 16K+512 ) 字 


I 
字 64 ( 128K+4K) 字 节 
large page 
( 4K+128 ) 字 节 (512K+16K) 字 节 


根据 每 一 个 存储 单元 中 所 存储 数据 的 位 数目 ，NAND Flash 分 为 SLC (Single-Level Cell) 、MLC (Multi-Level Cell) 和 TLC (Trinary-Level Cell) 类 


顾名思义 ，SLC 即 每 个 存储 单元 只 存储 1 位 数据 ， 表 示 “1” 或 “0”， 如 图 4-15 所 示 。 对 于 SLC 中 浮 置 栅 极 存储 电荷 的 电压 ， 其 与 某 个 特定 的 阔 值 电压 Vth 
相 比 ， 如 果 大 于 Vth 值 惑 表 示 “0”， 反 之 焉 表示 “1”。 


MLC 即 每 个 存储 单元 可 存储 两 位 数据 ， 如 图 4-16 所 示 。 通 过 将 浮 置 栅 极 存储 单元 的 辣 值 电压 分 成 多 个 立 值 电压 ， 并 控制 里 面 电荷 的 多 少 ， 而 达到 存储 成 
不 同 的 数据 。TLC 即 每 个 存储 单元 可 以 存储 3 位 数据 。 
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图 4-15 SLC 型 存储 单元 
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图 4-16 MLC 型 存储 单元 


如 图 4-17 所 示 是 SLC 型 和 MLC 型 NAND Flash 的 准 值 电压 分 布 示意 图 。SLC 只 有 两 种 逻辑 状态 ， 即 擦 除 状 态 “1” 和 编程 状态 “0”。 而 MLC 有 4 种 逻辑 状 
态 ， 即 探 除 状态 “11” 和 编程 状态 “01”、 “10”、 “00 ” 。 
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图 4-17 ”SLC 型 和 MILC 型 Flash 的 阅 值 电压 分 布 


SLC 和 MLC 型 NAND Flash 各 方面 对 比如 表 4-3 所 示 。 


表 4-3 SLC 与 MLC 型 NAND Flash 对 比 


项 目 SLC MLC 
成 本 高 低 
容量 小 下 
传输 速度 高 低 
托 电 
擦 除 / 编程 寿命 乱 ， 约 104 次 
出 错 率 E 
主要 用 途 高 性 能 、 高 可 靠 性 的 应 用 中 消费 类 产品 中 
编程 (1 页 ) 时 间 约 900ms 
允许 部 分 编程 数 ( 擦 除 块 前 ，) I 
从 表 4-3 中 对 比 数据 可 以 看 出 ，SLC 存 在 的 优势 主要 有 以 下 几 点 : 首先 ，SLC 可 重复 被 擦 写 的 次 数 约 十 万 次 ， 而 MLC 被 重复 擦 写 的 次 数 则 只 有 一 万 次 左右 ， 


在 理论 上 存在 10 倍 的 寿命 差距 ;其 次 ，SLC 的 读 写 速度 比较 快 ， 其 随机 读 速 度 是 25ns/Page、 而 MLC 随 机 读 的 速度 则 需要 50ns/Page， 同 时 由 于 Flash 写 入 后 
需要 先 被 擦 除 然后 才能 被 继续 写 入 ，MLC 写 入 时 间 需 要 2.8ms， 而 SLC 的 写 入 时 间 仅 需 0.7ms， 因 此 ，SLC 存 储 器 理论 上 更 加 适合 高 可 靠 性 以 及 高 速度 的 应 用 要 
求 ; 但 是 SLC 也 有 其 自身 的 劣势 ， 如 造价 成 本 比较 高 、 单 颗 心 片上 面 的 容量 提升 比较 困难 。 


由 于 SLC 具 有 读 写 速度 较 快 、 数 据 的 可 靠 性 相对 较 高 、 读 写 寿命 比较 长 等 方面 优 操 ， 将 会 得 到 一 定 的 友 展 ， 但 由 于 成 本 较 高 及 容量 等 方面 的 一 些 问题 ， 其 
定位 可 能 会 出 现 偏 移 ， 在 2003 年 MLC 还 没有 推出 之 前 ，NAND Flash 存 储 界 几乎 都 是 使 用 SLC 作 为 存储 介质 ， 工 业 级 、 消 费 级 以 及 通信 类 等 产品 上 面 都 是 SLC 
的 身影 。 但 伴随 着 电子 产业 以 成 本 为 先 的 法 则 作用 下 以 及 MLC 技 术 的 迅猛 友 展 ， 使 得 SLC 的 市 场 逐 渐 被 缩小 ， 目 前 就 生产 出 货 量 而 言 只 有 整个 NAND Flash 市 
场 的 10% 左 右 ， 其 目前 的 主要 市 场 正 转向 企业 级 和 工业 级 市 场 。 


由 于 MLC 在 其 单位 容量 上 能 够 做 到 更 低廉 成 本 的 同时 ， 在 单位 面积 上 能 够 得 到 更 大 容量 的 优点 ， 而 得 到 了 业界 的 不 断奶 捧 ， 一 路 向 前 发 展 ， 最 新 的 技术 与 
工艺 都 首先 被 用 在 了 MLC 上 ， 但 是 由 于 友 展 太 过 迅速 ， 工 艺 和 技术 等 方面 跟 进 不 力 ， 及 其 本 身 以 构 等 方面 的 一 些 原因 ， 其 实际 的 读 写 寿 命 从 最 初 的 一 万 次 降 到 
五 干 次 左右 ， 而 且 目 前 的 一 些 厂家 也 只 能 实现 三 干 次 左右 的 读 写 寿命 ， 其 稳定 性 以 及 可 靠 性 引起 了 业界 的 一 些 质疑 ， 因 此 目前 仪 有 消费 级 市 场 成 为 其 集中 的 市 


场 定位 。 
3. 基 本 操作 
针对 NAND Flash 主 要 有 三 种 基本 操作 ， 即 编程 操作 ( 写 操 作 ) 、 读 操作 和 擦 除 操作 。 下 面 分 别 介绍 这 三 种 操作 的 工作 原理 。 
(1) 读 操作 


同一 页 中 所 有 人 存 储 单元 的 控制 栅 极 相连 构成 字 线 ， 字 绪 平 时 保持 合适 的 电 平 状 态 ， 使 得 晶体 管 处 于 导 通 状态 。 当 需要 对 存储 单元 进行 读 取 操 作 时 ，NAND 
Flash 在 目标 存储 单元 所 在 页 的 字 线 上 加 低 电 压 (如 3V) ， 电 势 置 为 0， 而 将 其 他 页 的 字 线 上 的 电压 升 高 到 一 个 值 (如 10V) ， 电 势 较 高 ， 而 这 个 高 值 又 不 全 于 
使 得 电子 击 穿 隧道 氧化 层 进入 控制 栅 极 。 控 制 栅 极 在 读 取 数据 的 过 程 中 施加 的 电压 较 小 或 根本 不 施加 电压 ， 不 足以 改变 浮 置 栅 极 中 原 有 的 电 奏 量 ， 所 以 ， 读 数 


据 的 操作 不 会 改变 存储 单元 中 的 数据 。 


之 所 以 将 非 目 标 存储 单元 所 在 页 的 字 线 上 的 电势 提高 ， 是 为 了 让 其 他 页 中 的 所 有 存储 单元 的 源 极 和 漏 极 处 于 强制 导 通 状态 。， 导 致 不 能 将 这 些 页 中 的 存储 单 
元 的 电势 传递 到 位 线 上 。 而 在 读 取 操作 目标 页 的 字 线 上 没有 被 加 上 电压 ， 其 源 极 和 漏 极 是 否 可 以 导 通 ， 完 全 取决 于 其 浮 置 栅 极 中 是 否 仓 有 电子 。 


对 于 在 读 取 操作 目标 页 中 浮 置 栅 极 中 有 电 和 葆 的 存储 单元 来 说 ， 由 于 浮 置 栅 极 的 感应 作用 ， 在 源 极 和 漏 极 之 间 将 形成 市 正 电 的 空间 电 答 区 ， 这 时 无 论 控 制 树 
极 上 有 没有 施加 仿 置 电压 ， 晶 体 管 都 将 处 于 导 通 状态 ， 所 以 串联 这 一 页 的 位 线 上 会 显示 低 电 压 ， 表 示 数 据 “0”。 


而 对 于 在 读 取 操作 目标 页 中 浮 置 栅 极 中 没有 电荷 的 存储 单元 来 说 ， 源 极 与 漏 极 之 间 没 有 导电 通路 ， 只 有 当 在 控制 栅 极 上 施加 适当 的 偏 置 电 压 (VG) ， 在 
质 层 的 硅 基 中 才能 感应 出 电 集 ， 也 残 是 说 在 没有 给 控制 栅 极 施加 含 置 电压 时 ， 该 晶体 管 是 截止 的 ， 所 以 位 线 上 会 显示 高 电压 ， 表 示 数 据 “1”。 


通过 从 位 线 上 提取 目标 存储 单元 的 电势 状态 ， 残 可 以 判断 该 位 线 上 各 个 位 置 上 对 应 存储 单元 的 高 低 电 平 ， 即 可 判断 目标 页 中 相应 位 置 上 存储 单元 所 存储 的 
数值 。 


如 图 4-18 所 示 ， 当 需要 读 出 某 个 Page 时 ，Flash Controller 控 制 Flash 心 片 将 这 个 Page 的 相应 字 线 组 电势 置 为 0， 其 他 所 有 字 线 组 的 电势 则 升 高 到 一 个 
值 ， 而 这 个 值 又 不 至 于 使 电子 穿 过 FG 绝缘 层 到 达 FG。 这 种 工作 的 结果 是 ， 所 有 Cell 串 的 位 线 被 导 通 以 便 外 接 从 位 线 上 提取 的 电势 状态 ， 所 有 字 线 电压 被 提高 
的 Page 其 感应 线 均 被 断 开 ， 导 致 感应 线 不 能 将 对 应 Cell 的 电势 传递 到 位 线 上 ， 所 以 此 时 每 个 Cell 的 位 线 所 体现 的 电势 值 与 待 读 出 Page 中 所 有 (Cell 一 一 对 应 ， 再 
通过 电路 将 每 条 位 线 上 的 电势 值 解码 成 1 或 者 0 从 而 传输 到 忌 片 外 部 ， 放 置 于 SSD 的 RAM Buffer 中 保存 ， 这 就 完成 了 一 个 Page 内 容 的 读 出 。 


由 于 同一 页 上 的 所 有 存储 单元 共享 一 条 字 线 ， 所 以 NAND Flash 的 读 操作 的 基本 单位 也 是 一 页 。 





图 4-18 读 操 作 时 电压 状态 


(2) 写 操 作 





Flash 领 域 中 写 操作 又 被 称 为 “Program”， 即 编程 操作 。 由 于 Flash 的 最 常见 表现 形式 
需要 重新 写 入 新 程序 ， 即 Re-Program， 所 以 就 将 瑟 入 Flash 的 过 程 叫 作 Program 了 。 


EPRROM 一 般 是 只 读 的 ,一 旦 要 将 其 中 的 程序 进行 更 改 ， 则 


注意 ，NAND Flash 在 对 存储 单元 执行 编程 操作 之 前 ， 必 须 先 将 目标 存储 单元 控制 栅 极 中 的 电荷 放 掉 ， 即 先进 行 擦 除 操作 (原因 稍 后 解释 ) ， 使 得 目标 存 
储 单 元 都 处 于 逻辑 状态 “1”。 


同 存储 单元 内 写 入 数据 的 过 程 束 是 向 浮 置 栅 极 中 注入 电 稚 的 过 程 ， 如 图 4-19、 图 4-20 所 示 。 


控制 栅 CG 12~20V 


( 子 线 ) 控制 氧化 层 厚 <20nm 
浮 栅 FG 


FD | | 人 0mm 
没有 电子 。 ”万 同 





DIV 


接地 


图 4-19 NAND Flash 充 电 过 程 


一 般 向 晶体 管 中 写 入 数据 有 两 种 技术 ， 即 热电 子 注 入 (hot electron injection，CHE) 和 F-N 隧 道 (Fowler-Nordheim tunneling) 效应 。 其 中 ， 热 电 
子 注入 是 通过 源 极 给 浮 置 栅 极 充电 ， 而 F-N 隧 道 效 应 是 通过 底层 的 硅 基 层 向 浮 置 栅 极 充电 或 放电 (通常 适用 于 氧化 层 厚度 小 于 12nm 的 存储 器 件 ) 。 注 


= 


意 ，NOR Flash 是 通过 热电 子 注入 方式 给 浮 置 栅 极 充电 ， 通 过 F-N 隧 道 效 应 给 浮 置 栅 极 放电 。 而 NAND Flash 对 浮 置 栅 极 的 充电 、 放 电 过 程 则 都 是 通过 F-N 隧 


衬 底 (了 ) 





图 4-20 NAND Flash 写 操作 


F-N 隧 道 效 应 的 原理 是 : 在 浮 置 栅 极 和 硅 基 层 裤 底 之 间 加 一 个 电压 ， 在 氧化 层 中 会 形成 一 个 电场 。 由 于 浮 置 栅 极 外 面 的 氧化 层 表 面 的 电子 势 驹 很 高 ， 电 子 
难以 穿 过 势 驹 注入 浮 置顶 极 。 但 Fowler 等 人 提出 ， 当 氧化 层 中 电场 强度 达到 10mV/cm， 且 氧化 层 厚 度 较 小 (如 0.01hm 以 下 ) 时 ， 电 子 将 发 生 直接 隧 穿 效 
应 ， 即 穿 过 氧化 层 中 势 驹 注入 浮 置 栅 极 中 ， 这 被 称 为 F-N 隧 道 效应 。 


NAND Flash 编 程 操 作 的 具体 过 程 如 下 : 将 待 写 入 数据 的 存储 单元 所 在 页 的 字 线 电压 提高 到 一 定 程度 (20V 左 右 ) ， 而 不 写 入 数据 的 页 的 字 线 保持 低 电 压 
(10V 左 右 ) 。 如 果 遇 到 待 写 入 某 个 Cell 的 数据 位 恰好 为 1 的 时 候 ， 那 么 对 应 这 个 Cell 的 电路 不 做 任何 动作 ， 其 结果 依然 是 1; 如 果 遇 到 待 写 入 某 个 Cell 的 数据 位 


为 0 的 时 候 ， 则 电路 将 对 应 Cell 的 字 线 电压 提高 到 足以 让 电子 穿 过 绝缘 体 的 高 度 ， 这 个 电压 被 加 到 控制 栅 极 上 ， 从 而 对 Cell 中 的 浮 置 栅 极 进行 充电 ， 充 电 之 后 
CelI 的 状态 从 1 变 为 0， 完 成 了 写 入 ， 这 个 写 “0” 的 动作 又 叫 作 “Program” ， 即 对 这 个 Cell 进 行 了 Program。 


将 待 写 入 Cell 的 字 线 电压 升 高 到 一 定 值 ， 对 Cell 充 电 ， 充 电 成 功 ， 则 在 Cell 的 位 线 上 会 感应 出 一 定 的 电势 值 ， 通 过 检测 这 些 值 来 判断 电 倚 是 否 已 经 补充 入 ， 
如 果 位 线 上 并 没有 感应 出 正确 的 电势 ， 则 表示 对 应 这 个 位 线 的 Cell 串 中 对 应 的 Cell 可 能 已 经 损坏 ， 如 图 4-21 所 示 。 


由 于 同一 页 上 的 所 有 存储 单元 共享 一 根 字 线 ， 所 以 NAND Flash 的 编程 操作 的 基本 单位 是 一 页 。 如 在 small page 类 型 的 NAND Flash 中 进行 编程 操作 时 ， 
2 


会 将 一 整 页 的 要 存储 内 容 ， 包 括 数 据 存储 区 和 扩展 区 (512+16=528 字 节 ) ， 一 次 性 通过 |/O 线 输出 到 内 存 ， 表 传输 到 数据 寄存 器 (大 小 与 每 一 页 的 大 小 相 
同 ) ， 然 后 写 入 对 应 的 存储 单元 中 。 
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图 4-21 写 操 作 电 压 状态 
(3) 擦 除 操 作 


对 Flash 心 瞩 的 写 入 有 一 些 特殊 的 步骤 。Flash 心 片 要 求 在 修改 一 个 Cell 中 的 位 的 时 候 ， 在 修改 之 前 必须 先 擦 除 这 个 Cell。 以 机 械 磁盘 为 例 ， 机 械 磁 盘 上 
的 “数据 ”是 永远 都 抹 不 按 的 ， 如 果 你 认为 将 磁盘 全 部 写 入 “0” 融 算 抹 挥 的 话 ， 那 也 是 有 问题 的 ， 即 可 以 说 它 存 放 的 全 是 数字 0， 因 为 这 也 是 数据 。 那 么 是 否 
存在 一 种 介 于 1 和 0 之 间 的 第 三 种 状态 呢 ， 比 如 虚无 状态 ”有 人 可 能 会 联想 一 下 ，Cell “市 负电 ”、“ 帝 正 电 ”、 “不 市 电 ”， 这 不 融 正 好 对 应 了 三 种 状态 吗 ? 
我 们 可 以 将 不 市 电 规定 为 “虚无 ”状态 ， 是否 将 Cell 从 市 电 状 态 改 为 不 市 电 状 态 束 是 所 谓 的 擦 除 呢 ? 不 是 的 。 上 文 叙述 过 ，Cell 审 电表 示 0， 不 市 电表 示 
1，CelI 只 能 市 负电 傈 ， 即 电子 ， 而 不 能 市 正 电 倚 。 所 以 Cell 只 有 两 种 状态 ， 而 这 两 种 状态 都 表示 数据 。 


其 实 ， 这 里 的 Erase 动 作 就 是 将 一 大 片 连续 的 Cell 一 下 子 全 部 放电 ， 这 一 片 连 续 的 Cell 就 是 一 个 Block。 即 每 次 Erase 动 作 只 能 一 下 擦 除 整 个 Block 或 者 多 个 
Block， 将 其 中 所 有 的 Cell 变 为 “1” 状 态 。 但 是 却 不 能 单独 擦 除 某 个 或 者 某 段 Page， 或 者 单个 或 多 个 Cell。 


NAND Flash 的 擦 除 操作 的 实现 原理 也 是 F-N 隧 道 效 应 。 将 漏 极 上 的 位 线 开路 ， 在 源 极 上 加 正 电 压 (12~20V， 有 的 是 将 源 极 开路 ， 底 层 硅 基 底 上 加 正 电 
压 ) ， 字 线 接地 。 由 于 同一 个 块 的 所 有 存储 单元 共享 一 条 总 位 线 ， 所 以 NAND Flash 擦 除 操 作 的 基本 单位 是 块 。 擦 除 操 作 将 导致 该 块 中 的 所 有 浮 置 栅 极 中 含有 
电子 的 存储 单元 中 的 电子 由 浮 置 栅 极 流向 源 极 ， 使 得 该 块 内 所 有 存储 单元 的 浮 置 栅 极 中 都 不 再 含有 电子 ， 全 部 变 成 逻辑 状态 “1”， 如 图 4-22、 图 4-23 所 示 。 


注意 ，NAND Flash 只 能 通过 擦 除 操作 将 存储 单元 变 成 “1”， 这 也 丈 是 在 进行 编程 操作 之 前 ， 必 须 首先 进行 擦 除 操作 的 原因 了 。 
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图 4-22 NAND Flash 放 电 过 程 
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图 4-23 NAND Flash 擦 除 操 作 
4.2.3 NAND Flash 阵 列 


目前 ， 单 片 NAND Flash 容 量 最 大 为 8GB 或 16GB， 理 想 的 最 大 速度 为 40MB/s， 远 远 不 能 满足 存储 系统 中 大 容量 、 高 速度 的 需求 。 所 以 当今 固态 盘 产 品 中 
普遍 使 用 的 技术 是 将 多 块 芯 片 集成 在 一 起 ， 控 制 多 个 忌 片 并 行进 行 读 写 操作 ， 既 能 扩大 整个 固态 硬盘 的 容量 ， 又 能 显著 提高 固态 硬盘 的 读 写 速 度 。 目 前 ,许多 
设计 与 研究 人 员 关 注 于 多 个 Flash 器 件 的 管理 与 设计 架构 ， 提 出 许多 Flash 阵 列 的 管理 技术 ， 比 较 流行 的 Flash 阵 列 架构 主要 有 三 种 : 流水 线 Flash 阵 列 架构 、 位 
宽 扩 展 Flash 阵 列 架 构 和 全 连接 Flash 阵 列 架构 。 本 节 介绍 的 多 通道 Flash 阵 列 架构 是 基于 流水 线 Flash 阵 列 架 构 和 全 连接 Flash 阵 列 并 行 架构 设计 的 一 个 具体 方 
案 ， 具 体内 容 如 下 。 


图 4-24 为 此 方案 的 Flash 阵 列 架构 ， 每 个 通道 都 有 专用 的 一 组 数据 缓存 模块 、 控 制 寄存 器 模块 、ECC 校 验 模块 、NAND Flash 接 口 模 块 等 。 控 制 寄存 器 模 
块 负责 执行 处 理 器 的 读 写 请 求 ， 数 据 缓存 模块 用 于 缓存 数据 ，ECC 校 验 模 块 使 用 NAND Flash 专 用 的 ECC 校 验算 法 ， 能 检查 并 纠正 1 位 错误 ， 友 现 2 位 以 上 错 
误 ; NAND Flash 接 口 负责 与 Flash 阵 列 进行 交换 ,发送 写 命令 、 写 地 址 ， 读 写 数 据 等 操作 。 骨 入 式微 处 理 器 通过 读 写 某 个 通道 上 的 寄存 器 ， 实 现 相应 的 读 写 请 
求 。 处 理 器 既 可 以 对 一 个 通道 上 的 多 种 Flash 阵 列 进行 读 写 请 求 ， 也 可 以 在 多 个 通道 上 的 多 个 Flash 阵 列 上 进行 操作 。 
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图 4-24 ”多 通道 Flash 阵 列 框图 

1.NAND Flash 阵 列 的 操作 


一 般 来 说 ， 对 NAND Flash 心 片 进行 访问 一 般 包 括 两 步 ， 一 是 对 心 片 进行 片 选 ， 通 过 心 片 的 CE 信号 确定 ; 二 是 通过 数据 |/O 线 (I/O 线 是 数据 地 址 复 用 ) 对 
心 片 内 部 进行 页 面 (假设 每 个 页 面 2112 字 节 ) 访问 。 而 在 数据 写 入 阶段 又 包括 三 个 步骤 : 


1) 加 载 命令 : 负责 操作 命令 、 地 址 的 友 送 和 数据 的 传输 。 
2) 器 件 工作 : 器 件 进入 忙 状态 ， 执 行 相应 的 读 写 操作 。 
3) 数据 读 取 或 检测 : 读 取 数据 ， 或 者 检查 操作 结果 是 否 正 确 。 图 4-25 和 图 4-26 分 别 是 Page Read 和 Page Program 的 操作 步骤 。 


由 于 Flash 本 身 的 特性 ， 其 Page Read 和 Page Program 都 有 相当 长 时 间 是 器 件 忙 状态 ，Page Read 操 作为 20hs，Page Program 操 作为 200hs。 在 器 件 忙 
状态 期 间 ，Flash 各 个 引 脚 都 处 于 空闲 等 待 状态 。 通 过 研究 各 种 Flash 阵 列 架构 ， 充 分 利用 器 件 Busy 时 间 的 重 玛 性， 可 找 出 最 佳 设计 方案 。 


号 命令 器 件 读 数据 读数 据 


地 址 
20ps 2112x25ns=52.8hs 


图 4-25 ”Page Read 各 操作 步骤 所 需 时 间 








图 4-26 ”Page Program 各 操作 步骤 所 需 时 间 
2 通道 内 结构 与 性 能 


这 种 架构 在 通道 内 部 使 用 流水 线 方式 ， 多 个 Flash 阵 列 共 用 总 线 ， 在 某 Flash 器 件 工作 时 ， 对 其 他 Flash 进 行 读 写 等 操作 ， 在 时 间 上 实现 数据 总 线 的 复 用 ， 
缩短 Flash 阵 列 的 等 效 操作 时 间 ， 能 够 大 幅 减少 单个 Flash 占 用 的 总 线 时 间 ， 使 得 整体 Flash 阵 列 读 写 速度 得 到 提升 。 图 4-27 为 架构 通道 内 框图 。 
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图 4-27 架构 通道 内 框图 


在 通道 内 部 ， 通 过 Interleave 操 作 即 可 实现 流水 线 ， 使 得 多 个 器 件 忙 等 待 时 间 得 到 重 晋 ， 从 而 达到 缩短 通道 总 的 读 写 时 间 ， 同 时 也 提升 了 通道 内 的 容量 。 
下 图 4-28 是 通道 内 使 用 流水 线 执行 操作 的 时 空 图 ， 从 图 中 可 以 看 出 ， 对 于 器 件 忙 时 间 较 长 的 操作 ， 如 Page Program 操 作 ， 由 于 器 件 忙 等 竺 时间 较 长 ,使 用 了 
流水 线 操作 后 ， 通 道内 的 数据 线 得 到 充分 使 用 ， 从 而 整体 的 写 操作 性 能 大 大 提升 。 
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图 4-28 通道 内 流水 时 空 图 


(1) 通道 内 读 操 作 性 能 


根据 图 4-25 中 Page Read 各 个 操作 步骤 所 需 的 时 间 可 以 看 出 ， 在 Page Read 操 作 中 ， 器 件 Busy 时 间 为 20hs。 假 设 执行 命令 和 地 址 的 写 入 操作 时 间 为 1hs。 
如 果 在 通道 内 执行 多 个 Page Read 流 水 线 ， 在 第 一 个 器 件 执行 Page Read 操 作 后， 最 多 可 支持 20hs/1hs=20 个 执行 Page Read 命 令 的 写 入 ， 而 不 影响 第 1 个 器 
件 执行 。 即 通道 内 最 大 可 支持 21 个 die (die 是 晶 圆 上 的 小 方块 ， 一 个 芯 


芯片 里 可 能 封装 若干 个 die) ， 从 而 保证 在 第 21 个 执行 写 入 命令 后 ， 第 1 个 die 器 件 忙 才 结 


束 。 如 果 增 加 更 多 的 die， 将 导致 die 的 空间 ， 从 而 导致 每 个 时 刻 都 有 die 处 于 空 闪 状态 ,一定 程度 上 造成 了 系统 资源 的 浪费 。 通 道内 理论 上 执行 读 取 速率 的 性 
能 公式 为 : 


| 全 一 2112n peN 
(2) 通道 内 写 操作 性 能 
根据 图 4-26 可 以 看 出 ， 在 Program 操 作 中 ， 器 件 Busy 的 时 间 为 200hs， 假 设 执行 命令 和 地 址 的 写 入 操作 时 间 为 Ths。 如 果 在 通道 内 执行 多 个 Page 


Program 流 水 线 ， 则 在 第 一 个 器 件 执行 Page Read 操 作 后 ， 可 以 支持 200ps/ (52.8+1) ps=4 个 ， 即 通道 内 可 最 大 支持 5 个 die， 即 在 第 5 个 执行 写 入 数据 阶 


段 ， 第 1 个 die 器 件 忙 才 结 束 ; 增加 更 多 的 die 只 会 导致 更 多 die 的 空间 ， 造 成 资源 的 浪费 。 通 道内 理论 上 执行 写 入 操作 的 速率 性 能 公式 为 : 


2112n 
(52.8 + Dn+ 200 


充 水 线 执行 的 理论 值 : 根据 图 4-29 可 以 看 出 ， 随 着 流水 线 级 的 增多 ， 读 写 性 能 都 在 显著 增加 ， 特 别 是 写 操作 ， 使 用 了 三 个 die 后 ， 性 能 提升 
了 1 倍 ; 使 用 了 8 个 die 后 ,提升 了 3 倍 多 。 这 表明 ， 使 用 流水 线 技术 确实 能 显著 提升 系统 的 读 写 性 能 。 


Program 性 能 = (MB/ s) 


考虑 到 若 在 通道 内 添加 过 多 的 die， 每 个 时 刻 都 有 die 处 于 空闲 状态 ， 一 定 程度 上 造成 了 系统 资源 的 浪费 


。 综 合 考虑 ， 本 方案 在 通道 内 最 大 支持 8 级 流水 ， 
即 最 多 8 个 die。 支 持 多 个 die 同 时 执行 Page Read 和 同时 执行 Page Program， 以 及 读 写 混合 操作 。 
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3. 通 道 间 结构 与 性 能 


Altera 平 台中 使 用 了 标准 的 Avalon 忌 线 染 构 。Avalon 忆 线 架构 是 一 种 交叉 互 连 的 忌 线 架构 ， 它 允许 多 个 主 设备 同时 访问 多 个 从 设备 ， 由 互 连 结构 进行 专 
门 的 总 线 的 仲裁 ， 如 果 多 个 传输 之 间 没 有 关联 ， 则 可 以 并 发 执行 操作 ， 如 图 4-30 所 示 。 在 多 个 通道 之 间 使 用 全 连接 并 行 传输 技术 ， 各 通道 之 间 相 互 独 立 、 互 不 
影响 ， 可 并 发 工作 ， 同 时 实现 了 速度 和 容量 的 提升 。 由 于 各 个 通道 之 间 是 完全 独立 的 ， 而 CPU 只 有 一 个 ， 如 果 使 用 CPU 执 行 大量 的 读数 据 或 者 写 数 据 操作 ， 将 


大 量 占用 系统 总 线 ， 影 响 通道 间 的 读 写 性 能 ， 本 方案 添加 了 DM A 操作 ， 使 CPU 仪 执行 写 入 命令 和 地 址 的 操作 ， 而 由 DM 人 A 配合 控制 器 ， 完 成 数据 的 写 入 和 读 


取 ， 而 CPU 写 命令 占用 的 时 间 比 较 短 ， 对 于 具体 的 读 写 操作 来 说 非常 小 ， 所 以 从 忌 体 上 看 通道 间 是 并 行 工 作 的 。 


ll 


ee el 
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-一 一 一 一 人 
sh Flas _Flash | 





由 于 CPU 执 行 写 入 命令 和 地 址 的 时 间 比 较 短 ， 所 以 在 理论 上 ， 每 增加 一 个 通道 ， 读 写 性 能 就 增加 了 一 个 通道 的 读 写 性 能 。 假 如 有 十 个 通道 ， 系 统 的 读 写 性 
能 为 单 通道 的 十 倍 左右 。 


图 4-31 显 示 了 4 个 通道 ， 每 个 通道 有 两 个 die 共 同 执行 Page Program 操 作 。 从 图 上 可 以 明显 看 出 ，8 个 die 在 相当 长 的 时 间 里 重 赤 了 busy 时 间 ， 大 大 减少 了 
系统 的 Page Program 总 时 间 开 销 ， 提 升 了 系统 的 Page Program 性 能 。 
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图 4-31 4 个 通道 的 并 行 Program 操 作 


图 4-32 是 多 个 通道 执行 MO 操作 的 理论 值 性 能 值 。 





或 者 64 位 ， 为 了 进一步 提升 MO 性 能 ， 控 制 器 使 用 串 并 转换 模块 ， 目 动 将 8 位 与 32 位 进行 转换 ， 提 高 总 线 的 MO 位 寓 。 
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第 5 草 ”固态 仔 储 以 构 


本 章 以 固态 硬盘 (SSD) 为 例 介绍 固态 存储 架构 。 


5.1 概述 


与 传统 硬盘 相 化 ， 固 态 硬盘 内 部 没有 移动 的 机 械 磁 涉 ， 而 是 由 固态 电子 存储 心 刻 (闪存 心 片 ) 阵列 级 联 组 成 ， 并 通过 电压 完成 数据 的 读 取 操 作 。 图 5-1 给 
出 了 固态 硬盘 的 内 部 组 成 。 现 阶段 ， 几 乎 所 有 基于 闪存 的 固态 硬盘 都 具有 与 图 5-1 类 似 的 硬件 逻辑 结构 ， 具 有 较 强 的 普 适 性 。 
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图 5-1 态 硬盘 的 架构 


从 图 5-1 可 以 看 到 一 个 典型 的 固态 硬盘 由 主机 接口 逻辑 单元 (Host Interface Logic) 、RAM (缓存 ) 、 主 控 必 请 (SSD Controller) 和 多 个 内 存心 刻 组 


成 (闪存 心 片 和 主 控制 器 之 间 也 有 接口 ， 称 为 内 存 接口 ， 在 后 面 会 详细 介绍 ) 。 主 机 接口 屏 获 了 固态 硬盘 内 部 对 闪存 心 片 的 操作 ， 并 帮助 存储 系统 无 颖 地 对 固 
人 态 硬 盘 进 行 读 写 操作 。 主 控制 嚣 中 提供 了 各 种 处 理 操 作 、 内 存 管理 及 组 织 和 管理 内 存心 片 的 方法 〈 如 地 址 映射 、 损 耗 均衡 、 垃 圾 回收 、 坏 块 管理 等 ) ; 闪存 心 
片 通过 总 线 并 行 级 联 组 成 ， 该 组 织 方式 可 提供 并 行 访问 。 固 态 硬盘 内 部 的 RAM 则 起 到 了 缓存 和 加 速 的 作用 。 主 控 心 片 和 闪存 心 片 是 SSD 中 最 为 重要 的 两 个 元 器 
件 ， 也 是 影响 SSD 性 能 的 主要 因素 。 如 果 说 主 控 心 片 是 SSD 的 大 脑 ， 则 闪存 心 片 束 是 SSD 的 数据 仓库 。 


图 5-2 给 出 了 固态 硬盘 的 体系 结构 。 前 三 层 主 要 功能 是 接口 驱动 ， 提 供 缓冲 区 存放 读 写 请 求 的 数据 ， 并 且 提 供 请 求 队列 ,保存 没有 处 理 的 请 求 和 已 经 完成 
的 请 求 ， 实 现 对 固态 硬盘 的 高 效 管理 。 通 道 控 制 层 主要 是 控制 数据 的 并 行 存 储 ， 将 写 数据 分 友 到 各 个 闪存 控 制 器 上 。 闪 存 转 换 层 (Flash Translation 
Layer，FTL) ， 是 为 了 使 固态 盘存 储 系统 对 NAND Flash 更 好 地 支持 ， 充 分 发 挥 NAND Flash 人 存储 介质 的 优势 ， 主 要 实现 逻辑 /物理 地 址 映射 、 坏 块 管理 、 二 圾 
回收 和 损耗 均衡 等 功能 。 最 底层 是 闪存 接 口 屋 ， 即 传统 意义 上 的 硬件 抽象 层 (Hardware Abstract Layer，HAL) 。 
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闪存 接口 层 (HAL) 


图 5-2 态 硬 盘 的 体系 结构 


图 5-3 给 出 了 某 广 家 的 一 款 固态 硬盘 实物 图 照片 。 主 要 由 PCI-E 接 口 (主机 接口 ) 、 主 控 ( 主 控 心 片 ) 、RAM 缓 个 和 NAND 闪 和 存 和 PCB 基 板 组 成 。 
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图 5-3 态 硬 盘 实 物 图 


下 面 对 主 机 接口 、 主 控 心 片 、 缓 存 和 闪存 接口 进行 逐一 介绍 。 


主机 接口 是 固态 存储 设备 与 主机 之 间 的 连接 部 件 ， 是 二 者 进行 数据 传输 的 桥梁 。 现 在 的 固态 硬盘 一 般 都 采用 通用 接口 与 主机 连接 ， 对 主机 端 屏 菩 NAND 闪 

存 的 存储 特性 ， 在 主机 端 看 来 固态 硬盘 与 普通 硬盘 一 样 ， 没 有 任何 区 别 ， 这 就 提高 了 固态 硬盘 的 兼容 性 ， 使 得 我 们 现存 的 计算 机 系统 不 用 做 任何 改动 和 优化 即 
可 使 用 固态 硬盘 。 对 于 固态 硬盘 来 说 ， 目 前 主流 的 主机 接口 与 机 械 磁 盘 相 同 ， 是 ATA 或 SATA 接 口 。 除 了 第 3 章 介 绍 的 几 种 接口 之 外 ， 还 有 3 种 接口 是 固态 存储 
介质 常用 的 ， 即 USB 接 口 、eMMC 接 口 和 SDIO 接 口 ， 其 中 使 用 USB 接 口 的 固态 存储 设备 通常 被 称 作 U 盘 ， 而 使 用 eMMC 接 口 的 通常 束 是 消费 类 电子 产品 中 使 
用 的 存储 卡 ，SDIO 接 口 是 由 SD 存储 卡 的 接口 信号 SD 忆 线 发 展 而 来 。 这 三 种 接口 凭借 其 高 速 的 传输 和 易于 接受 的 价格 ,受到 了 用 户 的 广泛 欢迎 。 下 面 对 这 三 种 


接口 进行 重点 介绍 。 


USB (Universal Serial Bus， 通 用 串 行 总 线 ) 主要 是 用 来 连接 计算 机 与 外 围 委 置 之 间 的 总 线 ， 其 即 插 即 用 (Plug and Play) 的 功能 使 其 不 须 经 过 繁复 的 
安 疼 程序 便 可 任意 连接 、 配 置 、 使 用 及 移 除外 围 装置 。 而 由 于 USB 的 弹性 与 易于 使 用 ， 使 得 文 持 USB 的 外 围 装 置 产品 逐年 增加 ， 时 至 今日 ，USB 接 口 已 成 为 目 
COM port ( 串 行 闯 口 ) 以 后 ， 计 算 机 上 最 成 功 的 外 围 连 接 接 口 。 


(1) USB 友 展 历程 


USB 自 1994 年 提出 以 来 ， 到 目前 为 止 共有 四 个 版 本 : USB1.0、USB1.1、USB2.0 和 USB3.0。USB1.0 只 有 低速 (low speed，1.5Mbit/s) 一 种 传输 模 
式 ，USB1.1 增 加 了 全 速 (full speed，12Mbit/s) 模式 ，USB2.0 增 加 了 高 速 (high speed，480Mbit/s) 模式 ，USB3.0 又 增加 了 超 高 速 (Super 
speed，4.8Gbit/s) 模式 。 


早期 的 USB1.0/1.1 规 范 速度 只 有 12Mbit/s， 相 当 于 1.5MB/s 的 速度 。USB2.0 规 范 是 由 USB1.1 规 范 演变 而 来 的 ， 它 最 初 的 目标 是 将 USBI.1 的 传输 速率 提高 


10 ~ 20 倍 ， 而 实际 上 却 提 高 了 40 倍 ， 达 到 了 480Mbit/s， 约 为 60OMB/s。USB3.0 将 提供 4.8Gbit/s 的 理论 传输 速度 ， 相 当 于 600MB/s， 相 比 USB2.0 的 传输 速度 
提升 了 10 倍 。 新 的 USB3.0 标 准 能 够 让 更 多 机 器 设备 不 靠 外 接 电源 即 可 运行 使 用 ， 也 使 其 传输 速度 更 快 。 


(2) USB 结 构 


UsB 的 总 绪 结 构 是 采用 阶梯 式 星 形 的 拓扑 结构 ， 如 图 35-4 和 图 5-5 所 示 。 每 一 个 星 形 的 中 心 是 集线器 (Hub) ， 而 每 一 个 设备 可 以 通过 集线器 上 的 接口 来 加 
以 连接 。 从 图 中 可 以 看 到 UsB 的 设备 包含 了 两 种 类 型 : USB 集 线 器 与 USB 设 备 。 位 于 最 顶端 的 束 是 根 集线器 。 从 根 集线器 的 节点 往 下 连接 至 分 集线器 ， 再 由 集 
线 器 按 阶 梯 式 以 一 层 或 一 阶 的 方式 往 下 扩展 ， 连 接 在 下 一 层 的 设备 或 男 一 个 集线器 上 。 事 实 上 ， 集 线 器 也 可 视 为 一 种 设备 。 星 形 结构 的 最 大 层 数 为 6 层 (包括 
计算 机 内 部 的 根 集线器 ) 。 每 一 个 星 形 的 外 接点 的 数目 可 加 以 变化 ， 一 般 集线器 具有 2、4 或 7 个 接口 。 





Host(Root Tier) 


图 5-4 USB 总 线 星 形 结 构 


总 线 拓扑 


图 5-5” ”USB 总 吉 构 
USB 和 集线器 和 和 USB 设备。 所 有 在 USB 系 统 上 的 通信 都 是 在 软件 控制 下 由 PC 


了? 令 根 集线器 ， 然 后 由 根 





一 般 由 主机 控制 器 命 


一 台 PC 可 以 同时 连接 最 多 127 个 USB 设 备 ， 
环境 与 高 速 信 号 环境 隔离 


一 般 USB 系 统 的 基本 架构 可 以 分 为 三 个 主要 部 分 : USB 主 机 控制 器 / 根 集线器 
主机 激活 。 主 机 硬件 包括 USB 主 机 控制 器 和 USB 根 集线器 两 种 。 
负责 激活 USB 系 统 上 的 动作 处 理 ， 是 整个 USB 系 统 的 大 脑 


自 一 一 、\ 
局 ] 呆 率 


最 高 速 


委 标 等 ) 、 


速 系统 中 ， 集 线 器 起 着 很 重要 的 作用 ， 它 将 全 速 或 低速 f 
如 键盘 、 妃 全 速 设备 (传输 最 


* USB 主 机 控制 器 : 
* USB 根 集线器 : 提供 USB 连 接 端口 供 USB 设 备 或 USB 集 线 器 使 用 。 


集线器 传 到 正确 的 设备 地 址 。 
USB 集 线 器 主要 是 提供 另外 的 USB 连 接 端 口供 用 户 和 连接 设备 。 在 高 速 
低速 设备 (传输 最 高 速率 为 1.5Mbit/s， 
如 CCD、 移 动 硬盘 等 ) 。 


集线器 以 全 速 或 低速 连接 和 操作 。 


, 


高 速 集线器 允许 USB1.1 
USB 设 备 是 指 各 种 类 型 的 USB 外 围 设备 。USB 设 备 可 以 分 为 三 类 : 
如 早期 的 移动 硬盘 等 ) 、 高 速 设 备 (传输 最 高 速率 为 480Mbitys， 


为 12Mbit/s， 
(3) USB 物 理 接 口 


UsB 总 续 为 四 续 电 缆 ， 用 于 传输 信号 和 电源 ， 如 图 5-6 所 示 。 
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图 5-6 ” ”USB 接口 


黑 四 种 颜色 。 其 中 红色 为 电源 正极 (接线 上 标识 为 5V 或 者 VBUS) 
黑 线 为 地 线 (标识 为 G6GROUND 或 者 GND) 





和 
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USB 接 口 的 排列 方式 一 般 为 从 左 到 右 依 次 是 红 、 白 
为 D- 或 者 USB Port-) ， 绿 线 为 正 电 压 数据 线 (标识 为 D+ 或 者 USB Port+ ) 


在 USB 协 议 中 规定 ， 要 根据 不 同 的 USB 设 备 的 传输 速度 〈 低 速 、 全 速 、 高 速 ) 改变 在 设备 端的 提升 电阻 1.5kQ 的 位 置 。D+ 和 D- 两 条 信号 线 在 PC 主机 的 根 
集 续 器 或 集 续 器 端 同时 接 上 151.5k@ 的 下 拉 电 阻 并 连接 至 地 端 。 在 设备 未 连接 至 主机 根 集线器 或 集线器 的 连接 闯 口 时 ，D+ 和 D- 两 条 信号 线 因 为 下 拉 电 阻 的 原 
因 都 视 为 接地 。 当 设备 连接 到 端口 时 ， 由 于 提升 电阻 和 下 拉 电 阻 形成 分 压 器 ， 因 此 其 中 一 条 数据 信号 线 的 电位 被 提升 。 当 集线器 检测 到 其 中 一 条 数据 线 电 位 趋 
近 3V， 而 另外 一 条 仍 维持 接地 状态 时 丈 可 确定 有 一 个 USB 设 备 已 连接 上 。PC 主 机 会 每 隔 一 段 时 间 查 询 根 集线器 ， 检 查 D+ 和 D- 的 电位 变化 ， 以 了 解 设备 的 连接 


状态 
/Do 


随 着 各 种 数码 设备 的 大 量 普 及 ，USB 设 备 渐渐 增多 。 然 而 这 些 设备 虽然 都 是 及 用 了 USB 接 口 ， 但 是 这 些 设备 的 数据 线 并 不 完全 相同 。 这 些 数 据 线 在 连接 PC 
的 一 端 都 是 相同 的 ， 但 是 在 连接 设备 端的 时 候 ， 通 单 出 于 体积 的 考虑 而 采用 了 各 种 不 同 的 接口 。 下 面 列 出 几 种 不 同 的 UsB 接 口 。 


. USB-A 型 公 口 。A 型 公 口 是 最 为 常见 的 USB 接 口 ， 如 图 5-7 所 示 。 


. USB-B 型 公 口 。 这 种 接口 大 量 出 现在 一 些 体积 较 大 的 USB 设 备 上 ， 如 USB 接 口 的 打印 机 、 扫 描 仪 ， 如 图 5-8 所 示 。 





图 5-7 USB-A 型 公 口 





图 5-8 ”USB-B 型 公 口 


* Mini-B 型 5Pin。 这 种 接口 较为 常见 ， 由 于 防 误 插 性 能 出 众 ， 体 积 也 比较 小 巧 ， 所 以 正在 赢得 越 来 越 多 的 厂商 青睐 ， 现 在 这 种 接口 广泛 出 现在 数码 相机 以 
及 移动 硬盘 上 。 如 图 5-9 所 示 。 


* Mini-B 型 4Pin。 这 种 接口 常见 于 以 下 品牌 的 数码 产品 : 奥 林 巴 斯 的 C 系 列 和 已 系列 ， 柯 达 的 大 部 分 数码 相机 ， 索 尼 的 DSC 系 列 ， 康 柏 的 IPAQ 系 列 产品 。 如 
图 5-10 所 示 。 





图 5-9 Mini-B 型 5Pin 





图 5-10 ”Mini-B 型 4Pin 


` Mini-B 型 8Pin。 这 种 接口 适用 的 设备 如 Nikon Coolpix775。 如 图 5-11 所 示 。 


Mini-B 型 8Pin Round。 这 种 接头 可 见于 一 些 Nikon 数 码 相 机 ，Coolpix 系 列 比较 多 见 。 虽 然 Nikon 一 直 坚 持 用 这 种 接口 ， 但 是 在 一 些 较 新 的 机 型 中 ， 如 D100 


和 CP2000 也 都 采用 了 普及 度 最 高 的 Mini-B 型 5Pin 接 口 。 如 图 5-12 所 示 。 





图 5-11 ”Mini-B 型 8Pin 


图 5-12 ”Mini-B 型 8Pin Round 


. Mini-B 型 8Pin2X4。 这 种 接口 也 是 一 种 比较 常见 的 接口 ， 如 iRiver 的 MP3 系 列 。 如 图 5-13 所 示 。 








图 5-13 Mini-B 型 8Pin2 X4 


(4) USB 接 口 的 优点 和 不 足 
UsB 总 续 接 口 较 传统 串 行 通信 标准 接口 而 言 ， 具 有 许多 优点 : 
1) USB 接 口 使 用 方便 ， 统 一 的 物理 协议 和 连接 器 能 满足 多 种 外 设 需求 ， 无 须 册 为 不 同 外 设 准 备 不 同 的 接口 和 协议 。 


2) USB 接 口 自 带 电源 和 地 线 ， 可 由 总 线 提供 5V 电 压 和 最 多 500m 人 A 的 电流 ， 低 功 耗 外 设 无 须 外 接 电源 ， 非 常 适合 于 便携 设备 。 


4 


3) USB 接 口 支持 热 插 拔 ， 无 须 断 电 即 可 进行 设备 与 主机 的 连接 和 断 开 ， 操 作 非 常 简 便 。 


4) USB 接 口 真正 支持 即 插 即 用 ， 可 自动 识别 USB 轧 线 上 设备 的 插入 或 凶 载 ， 无 需 用 户 重 新 设 定 端口 地 址 和 中 断 请 求 。 


— 


5) USB 接 口 的 数据 传输 率 比 传统 通信 接口 快 十 几 倍 甚至 百倍 。 


4 


6) UsB 接 口 单独 使 用 自己 的 保留 中 断 ， 无 须 为 不 同 外 设 申 请 多 个 IRQ 资 源 和 内 人 存 MMO 地 址 ， 从 而 大 大 节省 系统 资源 。 


省 


7) UsB 接 口 协议 支持 同步 、 中 断 、 块 和 控制 传输 四 种 类 型 ， 可 满足 不 同 设备 的 数据 传输 要 求 ， 使 其 在 实际 应 用 中 更 具 灵 活性 。 


— 


8) USB 接 口 协 议 中 定义 了 完整 的 错误 检测 机 制 ， 可 以 保证 高 速 传输 过 程 的 可 靠 性 。 


尽管 在 理论 上 ，USB 可 以 实现 高 达 127 个 设备 的 串联 ， 但 是 在 实际 应 用 中 ， 也 许 串 联 3 ~ 4 个 设备 就 可 能 导致 一 些 设备 失效 。 而 且 大 多 数 USB 产 品 只 有 一 个 
输入 口 ， 根 本 无 法 再 连接 下 一 个 USB 设 备 。 另 外 ， 尽 管 USB 本 身 可 以 提供 500mA 的 电流 ， 但 一 旦 遇 到 高 电 耗 的 设备 就 会 导致 供电 不 足 。 解 决 这 些 问 题 的 办 法 是 
使 用 USB Hub， 但 目前 USB Hub 的 价格 相对 较 高 。 
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eMMC (embedded MultiMedia Card， 骨 入 式 多 媒体 存储 卡 ) 是 一 种 管理 型 的 NAND Flash。 芯 片 在 一 个 BGA 封装 内 集成 了 NAND Flash 以 及 NAND 
Flash 控 制 器 ， 控 制 器 将 坏 块 管理 、ECC 校 验 以 及 损耗 均衡 等 Flash 管 理 功 能 集成 于 芯片 内 部 ， 而 对 外 的 接口 采用 标准 的 MMC (Multi Media Card， 多 媒体 存 
储 卡 ) 接口 ， 使 用 者 只 需 开发 符合 接口 规范 的 控制 器 就 可 以 实现 芯片 的 使 用 ， 而 并 不 需要 像 开发 NAND Flash 控 制 器 那样 必须 关注 由 品牌 差异 、 生 产 工艺 改变 
以 及 兼容 性 带 来 的 控制 器 二 次 开发 问题 ， 从 而 大 大 减 小 设计 难度 ， 缩 短 了 设计 周期 。 简 单 来 说，eMMC=NAND Flash+ 内 部 Flash 控 制 器 + 标准 封装 接口 ， 其 
基本 特点 就 是 大 容量 、 高 速度 、 小 尺寸 并 且 低 开销 。eMMC 由 于 其 本 身 具有 的 特性 ， 已 经 广泛 应 用 在 移动 便携 设备 中 ， 如 智能 手机 和 平板 计算 机 ， 在 摄像 机 、 
汽车 电子 、 固 态 硬盘 、 楼 宇 安防 中 也 有 应 用 。 


(1) eMM5C 规 学 的 友 展 及 研究 现状 


eMMC 规 范 由 JEDEC (Joint Electron Device Engineering Council， 电 子 器 件 工程 联合 委员 会 ) 与 MMCA (Multi Media Card Association ， 多 媒体 


卡 协会 ) 共同 制定 并 由 JEDEC 负 责 修订 。 


eMMC 相 关 规 范 由 2007 年 7 月 提出 的 MMC4.1 规 范 发 展 而 来 。 最 初 MMC4.1 只 是 规定 了 电气 接口 规范 。 在 经 历 了 比较 快 的 一 次 版 本 更 新 之 后 ，2007 年 12 
月 eMMC 的 概念 在 eMMC4.3 规 范 中 被 首先 提出 ， 此 版 本 首先 提出 了 上 电 引 导 操 作 功 能 的 支持 特性 ， 对 eMMC 的 基本 特性 进行 了 详细 的 介绍 ， 此 时 eMMC 的 
忌 线 数 据 理论 传输 速率 最 高 为 2MB/s。2009 年 3 月 推出 的 eMMC4.4 规 范 中 引入 了 DDR (Dual Data Rate， 双 数据 速率 ) 类 型 的 数据 传输 模式 ， 将 忌 线 理论 
最 高 传输 速率 提高 到 了 104MB/s。 到 2011 年 6 月 ，eMMC4.5 规 范 中 首次 对 HS200 速 度 模式 进行 了 说 明 ， 将 数据 的 理论 最 高 传输 速度 提高 到 200MB/s， 此 时 符 
合 eMMC4.5 规 范 的 器 件 已 经 具备 了 一 套 元 整 的 敬 入 式 多 媒体 存储 卡 的 功能 ， 但 是 在 传输 速度 上 还 未 能 与 其 他 存储 介质 拉 开 差距 。 直 到 2013 年 9 月 ， 在 eMMC 
规范 比较 大 的 版 本 更 新 中 ，eMMC5.0 规 范 正式 推出 ， 这 时 已 经 能 够 支持 HS400 速 度 模式 ， 在 200M Hz 的 时 钟 频 率 下 总 线 理 论 最 高 传输 速率 可 以 达到 
400MB/s， 此 后 eMMC5.0 器 件 相 比 其 他 存储 介质 的 优势 更 加 凸显 。 如 今 e。MMC 规 范 已 经 在 2015 年 2 月 份 更 新 至 V5.1 版 本 ,但 是 还 没有 支持 该 规范 的 硬件 推 
出 。 


各 大 存储 厂商 有 着 种 类 丰富 的 eMMC 产 品 , 像 Samsung (三 星 ) 、SanDisk ( 闪 迪 ) 、Micron ( 镁 光 ) 和 Toshiba (东芝 ) 等 国外 公司 一 直 走 在 eMMC 
产品 研发 的 前 列 ， 其 中 尤其 以 三 星 公司 最 为 积极 ， 市 面 上 大 部 分 的 eMMC 忌 片 都 是 由 其 提供 ， 并 且 在 对 新 版 本 的 规范 支持 上 也 做 到 了 积极 响应 ， 在 eMMC5.0 
规范 的 芯片 推出 上 领先 其 他 厂商 ，2014 年 市 面 上 eMMC5.0 芯 片 几 乎 都 是 三 星 公司 提供 ， 而 镁 光 在 2014 年 年 底 也 正式 推出 支持 eMMC5.0 规 范 的 芯片 。 市 面 上 
的 eMMC5.0 心 片 单 片 最 大 容量 达到 128GB， 最 大 理论 写 入 速度 达到 100MB/s， 最 大 理论 读 取 速度 达到 250MB/s。 


国内 规模 最 大 的 存储 产品 与 方案 供应 商 江 波 龙 电子 有 限 公司 也 在 2011 年 推出 了 国内 第 一 款 支 持 eMMC4.41 规 范 的 嵌入 式 存储 芯片 ， 这 也 为 本 土 吊牌 打破 
海外 厂商 一 直 以 来 垄断 这 一 市 场 的 局 面 。 并 且 江波 龙 公司 已 推出 支持 eMIMC5.0 规 范 的 芯片 ， 最 大 容量 128GB。 江 波 龙 公司 的 eM MC 产 品 具有 自主 知识 产权 ， 
具有 独创 的 IDA (Initial Data Accelerating) 、Cache Mode、 断 电 保护 和 固件 备份 等 特性 ， 并 且 其 结构 兼容 JEDEC 标 准 封装 ， 具 有 非常 紧凑 的 物理 构造 ， 可 
以 为 电子 设备 的 开发 有 效 节约 PCB 的 空间 资源 ， 从 而 为 系统 提供 更 为 灵活 的 设计 空间 。 下 文 以 MMC5.0 为 基础 进行 介绍 。 


(2) eMMC 特 点 简 述 
eMMC 器 件 是 符合 eMMC 规 范 的 存储 芯片 ， 本 书 研究 的 是 符合 eMMC5.0 规 范 的 器 件 ， 外 部 接口 通过 间接 访问 存储 区 的 方式 实现 数据 的 传输 。 这 种 间接 的 


访问 由 内 部 的 NAND Flash 独 立 控 制 器 实现 。 这 种 机 制 的 优势 在 于 心 片 外 部 的 主 控制 器 不 直接 参与 存储 区 的 管理 ， 而 存储 区 可 以 在 内 部 控制 器 的 管理 下 执行 多 
个 后 台 的 操作 。 这 样 束 使 得 主 控制 器 的 存储 控制 更 为 简化 。 


eMMC 器 件 支持 以 下 特性 : 
. 系统 供电 电压 模式 支持 1.8V 或 3.3V 供 电 ， 如 表 5-1 所 示 。 
表 5-1 eMMC 器 件 供 电 模 式 
ETEE ET 


接口 供电 电压 (Vceo) 2.7~3.6 1.7~1.95 或 2.7~3.6 
存储 访问 供电 电压 (Ve) py 1 .7~1.95 或 27-3.6 


11 位 总 线 ( 时 钟 线 ， 数 据 锁 存 线 ，1 位 命令 线 ，8 位 数据 线 ) 和 1 位 复位 信号 线 。 时 钟 频率 为 0 一 200MHz; 3 种 不 同 的 数据 总 线 位 宽 模 式 为 1-bit (默认 ) 、 
4-bit 和 8-bit。 

` 数据 保护 机 制 : 窗 码 保护 、 永 久保 护 、 上 电 保护 和 临时 保护 。 

` 多 类 型 读 写 模式 : 单数 据 块 模式 和 多 数据 块 模式 。 

突然 断 电 的 数据 保护 机 制 。 

低 功 耗 休 了 眠 模式 。 


` 提升 主 控制 器 与 器 件 交互 性 能 的 机 制 : 断 电 须 知 机 制 、 高 优先 级 中 断 (HPI) 机 制 、 后 台 操 作 机 制 、 分 区 操作 机 制 、 分 区 性 能 提升 机 制 、 分 区 属性 分 配 
机 制 、 数 据 标签 机 制 、 封 装 命令 机 制 、 可 选 缓存 机 制 和 灵活 的 数据 单元 划分 机 制 。 


. 针对 高 容量 的 器 件数 据 单 元 划分 : 512B 扇 区 器 件 和 4KB 扇 区 器 件 。 
(3) eMMC5.0 的 系统 概述 


eMMC5.0 规 范 包 含 了 对 接口 功能 和 器 件 控制 器 的 描述 。 规 范 对 eMMC 系 统 的 描述 包含 了 eMMC 外 部 的 控制 器 和 对 应 的 eMMC 器 件 ， 规 范 对 接口 作 了 详 
细 的 说 明 ， 但 是 对 于 外 部 的 eMMC 控 制 器 不 作 过 多 规定 ， 内 部 的 Flash 控 制 器 由 各 个 器 件 厂商 自行 设计 ， 只 需 对 外 部 提供 符合 eMMC 规 范 的 标准 MMC 接 口 即 
可 。eMM5C5.0 的 系统 描述 如 图 5-14 所 示 。 图 中 不 同 区 域 代 表 了 eM M5C 规 学 中 作出 说 明 的 苑 围 。 





Ca 
Gm mm Rn 


于 


机 
“2 
1! 
1! 
11! 
L! 
Rs. 


| 
| 
| 
| 
| 
L 


让 avwmvc 规 区 定义 ， 同一 规定 
| ”| :MMC 规 范 建议 ， 不 作 统 一 规定 
| ciaisismz 


图 5-14 eMMC 器 件 系 统 


其 中 eMMC 的 总 线 功能 和 eMMC 的 供电 规范 是 明确 指出 的 ， 对 于 符合 eMMC 规 范 的 器 件 ， 只 需 根据 接口 规范 和 供电 要 求 设计 硬件 电路 和 eMMC 控 制 器 即 


。eMM5C35.0 规 泡 对 接口 规 沁 的 摘 述 在 接 下 来 的 内 容 中 详细 介绍 。 


1) eMMC5.0 的 器 件 结 构 。 


eMM5C5.0 规 沁 中 对 器 件 的 摘 述 框图 如 图 ?-15 所 示 。 
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图 5-15 ”eMMC 5.0 的 器 件 结构 


eMM5C5.0 器 件 的 接口 总 线 为 : 


CLK: eMMC5C 的 时 钟 线 ， 每 个 时 钟 周期 可 在 CM D 线 上 传输 1bit 的 命令 或 响应 信号 ， 或 者 在 数据 线 上 传输 1bit 数 据 (SDR， 单 数据 速率 模式 下 ) 或 2bit 数 据 
(DDR， 双 数据 速率 模式 下 ) 。 时 钟 的 频率 范围 为 0 到 最 大 时 钟 频率 。 


CMD: eMMC 的 命令 响应 传输 线 ，CMD 信 号 有 两 种 操作 模式 ， 即 针对 初始 化 的 开 漏 模式 和 针对 快速 命令 传输 的 推 挽 模式 。 主 控制 器 向 eMMC 发 出 命令 
言 号 后 ，eM MC 会 将 响应 再 通过 CMD 线 返回 。 


Reset: 复位 信号 线 ， 用 于 硬件 复位 。 


Data Strobe: 数据 锁 存 线 ， 用 于 HS400 速 度 模式 下 MMC 器 件 输出 数据 时 的 信号 锁 存 ， 该 信号 的 频率 与 CLK 的 频率 相同 。 数 据 输出 在 DDR 模 式 时 ， 在 时 
钟 信 号 的 上 升 沿 和 下 降 沿 各 对 应 一 位 数据 。 对 于 CRC 状 态 返 回 ，CRC 的 状态 仅仅 锁 仔 在 该 信号 的 上 升 沿 ， 与 下 降 治 无 关 。 


DAT0~ DAT7: eMM< 的 双向 数据 总 线 ， 数 据 线 工 作 在 推 挽 模式 下 。 同 一 时 刻 外 部 主 控制 器 和 eM MKC 只 能 有 一 方 拥有 数据 总 线 的 占有 权 。 默 认 状 态 下 ， 
上 电 或 复位 之 后 只 有 DAT0 用 作 数 据 传 输 。eMM< 的 数据 总 线 宽 度 可 以 由 主 控制 器 进行 配置 ， 可 选择 使 用 DAT0 ~ DAT3 的 4bit 模 式 或 者 使 用 DAT0 ~ DAT7 的 
8bit 模 式 。eMMC 内 部 包含 了 DAT1 ~ DAT7 的 内 部 上 拉 。 在 选 定 4bit 模 式 后 ，eMMC 会 立即 断 开 DAT1、DAT2、DAT3 的 内 部 上 拉 。 相 应 的 ， 如 果 选 定 8bit 模 
式 ，eMMC 会 断 开 DAT1 ~ DAT7 的 内 部 上 拉 。 


2) eMMC5.0 的 速度 模式 。 


eMMC5.0 规 范 是 向 前 兼容 的 ， 尤 其 在 速度 模式 上 是 兼容 低速 度 模式 的 。eMMC5.0 规 范 在 以 前 版 本 的 基础 上 提出 了 HS400 速 度 模式 ， 该 速度 模式 最 高 支持 
200M Hz 的 时 钟 频 率 ， 并 且 此 模式 只 支持 DDR 类 型 的 数据 传输 ， 数 据 六 线 上 理论 的 传输 速度 最 高 可 达 400MB/s。 表 5-2 为 e:MMC5.0 规 范 的 思 线 速度 模式 分 


类 。 


下 ET 
兼容 MMC 模 式 | sDR | 38l2V | 1l48bit | 0-26MHz 26MB/s 
高 速 SDR 模式 SDR 3/1.8/1.2V 52MB/s 


eMMC5.0 的 速度 模式 有 5 种 ， 其 中 前 三 种 速度 模式 是 为 兼容 4.5 版 本 之 前 的 规范 ， 而 HS200 和 HS400 速 度 模式 的 引入 大 大 提高 了 eMMC 的 读 写 速度 。 从 电 
压 要 求 来 看 ， 如 果 eMMC5.0 器 件 要 配置 为 HS200 和 H400 模 式 ， 其 总 线 接口 供电 电压 必须 是 1.8V 或 1.2V。 





当 eMMC 器 件 处 于 HS200 速 度 模式 时 ， 规 范 中 对 主 控制 器 和 系统 的 功能 接口 框图 拉 述 如 图 5-16 所 示 。 图 中 展示 了 一 个 典型 的 HS200 模 式 下 的 主 控制 器 和 
器 件 系统 。 主 控制 器 中 包含 一 个 时 钟 生成 模块 ， 为 器 件 提供 工作 时 钟 。 当 向 eM MC 器 件 写 入 数据 时 ， 时 钟 信 号 和 数据 信和 号 的 方向 是 相同 ， 此 时 不 管 传输 线 的 延 
迟 如 何 ， 数 据 是 与 时 钟 同步 的 。 当 从 eM M(C 器 件 读 取 数 据 时 ， 时 钟 信号 的 流向 和 数据 信号 是 相反 的 ; 主 控制 器 接收 的 数据 延迟 由 往返 延迟 、 输 出 延迟 和 主 控制 
器 和 器 件 之 间 的 延迟 组 成 。 所 以 当 从 eMMC 器 件 读 取 数据 时 ， 主 控制 器 需要 寻找 一 个 最 佳 的 读 取 数 据 采 样 点 来 保证 数据 读 取 的 可 靠 性 。 


数据 、 Flash 存 储 区 
命令 & 响 应 


主 控制 融 





图 5-16 ”HS200 速 度 模式 下 主 控制 器 和 器 件 框图 


图 5-17 描 述 了 HS400 速 度 模式 下 主 控 制 器 和 器 件 的 框图 ， 尤 其 是 给 出 了 Data Strobe 线 的 使 用 机 制 。 与 HS200 速 度 模式 类 似 ， 主 控制 器 都 要 向 eMMC 器 件 
提供 时 钟 信号 ， 特 别 的 是 当主 控制 器 从 eMMC 器 件 读 取 数 据 时 ， 是 根据 eMMC 器 件 的 Data Strobe 信 号 线 进行 数据 锁 存 的 ， 这 确保 了 DDR 模 式 下 数据 传输 的 
同步 性 。 


Flash 存 储 区 


啊 应 输入 接口 





图 5-17 HS400 速 度 模式 下 主 控 制 器 和 器 件 框图 
3) eMMC5.0 的 工作 模式 。 


主 控制 器 和 eMMC 器 件 之 间 的 交互 都 是 由 主 控制 器 主导 的 。 主 控制 器 向 eMMC 器 件 发 送 命 令 ， 然 后 eMMC 器 件 会 作出 对 应 的 响应 (如 果 该 命令 有 响 
应 ) 。eMMC5.0 规 范 将 eMMC 器 件 的 工作 模式 划分 为 5 种 ， 在 每 种 工作 模式 下 对 应 的 eMMC 器 件 状 态 忆 共有 17 种 。eMMC 的 工作 原理 惑 是 在 eMMC 主 控制 
器 的 控制 下 在 不 同 的 工作 模式 以 及 状态 之 间 转 换 并 完成 相应 的 数据 操作 。 这 5 种 工作 模式 如 下 。 


` 引导 模式 (Boot mode) 。eMMC 器 件 在 上 电 、 接 收 到 CMD0O (参数 为 0xFOFOFOF0) 命令 或 硬件 复位 之 后 会 处 于 引导 模式 。 


:器件 识别 模式 (Device identification mode) 。 当 引导 模式 结束 之 后 或 者 主 控 制 器 /器 件 不 支持 引导 模式 ， 器 件 就 会 直接 进入 器 件 识 别 模式 。 在 收 到 
SET_RCA (CMD3) 命令 前 器 件 都 会 处 于 器 件 识别 模式 。 


` 中 断 模 式 (Interrupt mode) 。 主 控制 器 和 器 件 会 同时 进入 或 退出 中 断 模式 。 在 中 断 模式 中 没有 数据 传输 。 中 断 模式 中 唯一 允许 的 信息 交互 就 是 器 件 向 主 
控制 器 发 出 的 中 断 请 求 。 


. 数据 传输 模式 (Data transfer mode) 。eMMC 器 件 的 主要 工作 模式 。 器 件 会 在 接收 到 主 控制 器 分 配 的 RDA (Relative Device Address， 器 件 关 联 地 址 ) 之 后 
进入 数据 传输 模式 。 对 于 主 控制 器 来 说 ， 在 识别 器 件 之 后 就 应 该 进入 数据 传输 模式 。 


` 未 激活 模式 (Inactive mode) 。eMMC 器 件 会 在 操作 电压 范围 或 者 访问 模式 无 效 的 时 候 进 入 未 激活 模式 。 通 过 GO_INACTIVE_STATE (CMD15) 命令 也 
可 以 使 器 件 进入 未 激活 模式 。 器 件 复 位 后 会 处 于 Pre-idle 状 态 。 


(4) 忌 线 协议 介绍 


器 件 上 电 或 复位 后 ， 主 控制 器 必须 按照 总 绪 协 议 对 eM MC 器 件 进行 初始 化 。 这 些 特殊 的 信息 传输 是 由 命令 、 响 应 和 数据 组 成 的 。eM M5C 的 总 绪 数 据 传 输 
由 命令 、 响 应 和 数据 块 的 组 合 构成 。 一 次 数据 传输 融 称 为 一 次 “总 线 操作 ”。 操 作 辟 是 包含 合 令 和 响应 ， 有 些 操 作 还 包含 数据 ， 如 数据 传输 操作 。 


1) 命令 和 响应 。 


eMM< 的 命令 也 是 基于 数据 块 的， 命令 的 友和 送 都 是 由 一 个 命令 数据 块 跟随 着 一 个 CRC7 校 验 。 如 图 ?5-18 所 示 为 命令 的 友 送 格式 。 以 “0” 开 始 , 以 “1” 结 
束 ,命令 的 友 送 是 可 重复 的 ，。 


响应 共有 5 种 ， 图 5-19 描 述 了 各 种 响应 在 CMD 线 上 的 传输 格式 。 


读 取 数 据 和 写 入 数据 操作 人 允许 单 块 或 多 块 的 数据 传输 。 与 顺序 读 操作 类 似 ， 当 进行 多 块 数据 传输 时 是 由 “ 集 止 传输 ”命令 来 终止 操作 的 。 图 5-20 摘 述 了 单 
块 读 操 作 和 多 块 读 操 作 。 在 进行 单 块 数据 读 操 作 时 ， 主 控制 器 通过 CMD 信 号 线 发 送 命 令 ，eMMC 器 件 接收 命令 之 后 会 做 出 咽 应 ， 并 通过 CMD 信 号 线 发 送 至 主 


控制 器 ， 在 命令 和 响应 的 传输 中 都 是 包含 CRC7 校 验 以 保证 传输 的 正确 性 的 。 同 时 在 数据 线 DAT0~ DAT7 (根据 位 宽 的 设置 可 以 变化 ) 上 向 主 控制 器 友 送 数 
据 ， 每 根 数据 线 上 的 数据 都 会 在 最 后 跟随 一 个 CRC16 校 验 保证 数据 传输 的 正确 性 ， 也 为 主 控制 器 校 验 数 据 提供 依据 。 而 在 多 块 数据 的 读 操 作 中 ， 主 控制 器 友 送 
读数 据 命 令 之 后 eMMC 作 出 响应 ， 并 会 连续 地 友 送 数据 块 直到 主 控制 器 友 送 停止 读 取 数据 的 命令 ，eMMC 器 件 才 不 向 外 发 送 数 据 。 


结束 位 


am -下 TssmsTaeol 


“传输 位 校 验 位 


总 长 度 48 位 


图 5-18 命令 的 发 送 格 式 





起 始 位 RI1/R3/RA/RS 结束 位 





a 
a) be 





总 长 度 136 位 
b) 总 长 度 为 136 位 


图 5-19 ”响应 传输 格式 







2ATO~7 


多 块 读 操 作 


图 5-20 ”数据 块 读 操作 


而 在 数据 块 的 写 操作 中 引入 了 一 个 “ 忙 ”标志 信号 ， 位 于 数据 线 DAT0 上 。 如 图 5-21 所 示 为 数据 块 的 写 操作 。 在 进行 单 块 数据 写 操作 时 ， 主 控制 器 通过 
CMD 信 号 线 发 送 命 令 ，eMMC 器 件 接收 命令 之 后 会 做 出 响应 ， 并 通过 CMD 信 号 线 发 送 至 主 控 制 器 ， 主 控制 器 获取 eMMC 器 件 的 响应 之 后 才 向 器 件 发 送 数 
据 ， 数 据 的 传输 也 是 在 DAT0~ DAT7 (根据 位 宽 的 设置 可 以 变化 ) 上 进行 的 。 而 在 友 送 数据 时 ， 主 控制 器 也 为 每 个 数据 块 后 加 入 CRC16 校 验 ，eMMC 器 件 依据 
CRC16 校 验 来 判断 数据 的 正确 性 。 而 eMMC 器 件 校 验 成 功 后 会 将 数据 编程 到 Flash 存 储 区 ， 这 个 过 程 中 eMMC 器 件 会 将 数据 线 DATO 拉 低 向 主 控制 器 指示 “ 编 
程 必 ”， 主 控制 器 由 此 可 以 判断 器 件 是 否 完 成 数据 的 写 入 操作 。 而 在 多 块 数据 写 操作 中 ， 主 控制 器 在 发 送 命 令 并 获取 响应 之 后 执行 连续 的 数据 块 友 送 操作 ， 直 
到 发 送 停 止 命令 来 终止 多 块 写 操作 。 


2) CRC 校 验 状 态 。 


在 写 数据 操作 中 ，eMMC 器 件 会 对 主 控制 器 友 送 的 数据 进行 CRC 校 验 ， 并 以 一 个 3bit 的 校 验 结果 在 数据 线 DAT0 上 指示 。 
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多 块 写 操 作 
图 5-21 ”数据 块 写 操作 
CRC 状 态 校 验 只 是 针对 写 数据 操作 过 程 。 如 图 5-22 所 示 ，CRC 校 验 状 态 的 格式 也 是 以 “0” 开 始 ， 以 “1” 结 束 。 若 校 验 失败 ， 主 控制 器 需要 进行 重新 发 送 


数据 或 其 他 后 续 操 作 。 


起 始 位 起 始 位 
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CRC 校 验 正 确 CRC 校 验 错误 






图 5-22 ” 校 验 状态 正确 与 错误 指示 
(5) 三 星 eMMC5.0 系 列 产品 ( 见 表 5-3) 


三 星 eMMC 产 品 提供 高 性 能 NAND Flash， 可 提高 数据 传输 速率 ， 可 以 实现 更 多 、 更 快 的 多 任务 处 理 、 网 页 浏览 、 应 用 程序 的 下 载 和 文件 传输 ， 以 及 高 清 
晰 度 的 视频 回放 ， 并 能 运行 大 文件 游戏 。 三 星 eM MC 还 可 以 帮助 简化 和 减少 最 新 的 消费 电子 产品 包括 平板 计算 机 、 智 能 手机 、GPs 系 统 ， 电 子 阅读 器 和 其 他 移 
动 计 算 设 备 对 大 容量 存储 器 设计 的 过 程 和 时 间 。 根 据 最 新 的 eM MC JEDEC 规 格 ， 三 星 eMMC 构 造 崇 凑 ， 尺 寸 要 小 于 一 个 典型 的 邮票 大 小 ， 有 效 地 为 移动 设备 
的 PCB 节 省 了 空间 。 标 准 化 的 包 闪 和 设计 规格 ， 加 上 智能 固件 设计 提供 了 一 个 灵活 的 设计 空间 和 通用 产品 。 


三 星 eMMC5.0 系 列 的 产品 容量 为 4~ 64GB，16 ~ 64GB 都 是 基于 三 星 的 64GB、10 纳 米 级 NAND Flash 技 术 ， 接 口 速度 高 达 400MB/s。 三 星 公 司 称 32GB 
和 64GB 的 eMMC PRO 随 机 读 取 数据 速度 为 7000IOPS (inputs/outputs per second) ， 随 机 写 入 数据 速度 为 70001OPS。 另 外 ， 该 存储 的 顺序 读 取 数据 速度 
为 250MB/s， 顺 序 写 入 数据 速度 为 90MB/s。 三 星 公司 和 暂 未 提供 16GB eMMC PRO 的 数据 。 


表 5-3 三星 eMMC5.0 系 列 产 品 


EE ET EC 
KLM4G1FEAC-B031 eMMC 5.0 
KLM8G1GEAC-B031 | 8GB eMMC 5.0 
KLMAG2GEAC-B031 | 16GB Class2000 | eMMC 5.0 
KLMBG4GEAC-B031 | 32GB 153-ball BGA eMMC 5.0 
KLMCG8GEAC-B031 | 64GB 153-ball BGA eMMC 5.0 








3.SDIO 接 口 


SDIO 接 口 是 由 SD 人 存储 卡 的 接口 信号 一 一 SD 总 线 发 展 而 来 ， 它 在 机 械 、 电 路 、 功 耗 、 信 号 与 软件 上 与 SD 存 储 卡 完全 兼容 ， 但 SDIO 接 口 可 扩展 性 更 强 ， 传 
输 速 度 更 快 。SDIO 接 口 硬件 主要 由 三 个 部 分 组 成 : SDIO 主 控制 器 、SD 总 线 和 SDIO 卡 。SDIO 主 控制 器 是 SDIO 接 口 与 系统 连接 的 部 分 ， 与 内 部 系统 总 线 相 
连 ; SDIO 卡 是 具体 功能 的 实现 单元 ; SDIO 主 控制 器 通过 SD 总 线 与 SDIO 卡 进行 命令 和 数据 的 交互 。SDIO 接 口 具 有 以 下 特点 : 


` 面向 各 种 移动 与 固定 设备 的 应 用 

` 对 SD 总 线 兼容 性 非常 好 ， 只 需 少 量 改动 。 

" 支持 即 插 即 用 。 

" 兼容 多 种 存储 卡 及 SDIO 设 备 ， 支 持 SDIO 卡 、 复 合 SDIO 卡 、SD 存 储 卡 和 MMC 卡 。 
- 每 个 SDIO 卡 最 多 支持 7 个 I/O 功 能 模块 和 1 个 存储 区 。 

- 允许 SDIO 卡 向 控制 器 发 出 中 断 申 请 。 

. 初始 化 电压 为 2.0~3.6V， 工 作 电 压 为 3.1 一 3.5V。 

(1) SDIO 接 口 通信 机 制 


SDIO 主 控制 器 与 外 设 的 连接 如 图 5-23 所 示 。 图 中 CLK 为 时 钟 信和 号， 由 主 控制 器 提供 给 外 设 ;，CMD 为 1 位 双 同 命令 忌 线 ， 用 于 命令 和 响应 信号 的 传输 ; 
DAT[3: 0] 为 4 位 双向 数据 总 线 (MMC 卡 数据 线 可 达 8 位 ) ， 用 于 数据 的 传输 ， 其 中 DAT[0] 除 了 用 于 数据 传输 外 还 用 于 从 机 友 送 “ 忙 ”状态 响应 和 CRC 校 验 结 


末 。 


DAT[3 : 0] 





LLK 
CMD 


图 5-23 SDIO 接 口 主 从 设备 连接 图 





SDIO 接 口 的 主 从 设备 通过 命令 /响应 的 方式 进行 信息 交互 及 完成 对 数据 传输 过 程 的 控制 。 与 系统 总 绪 不 同 ，SDIO 接 口 的 主 从 设备 间 必 须 有 一 套用 于 通信 
的 命令 集 和 相对 应 的 响应 集 。 接 下 来 将 介绍 sD 协 议 对 命令 、 响 应 、 数 据 格 式 传输 时 序 的 相 天 规定 。 


1) SD 协议 命令 /响应 格式 。 


SDIO 主 控制 器 通过 CMD 总 线 发 送 命 令 和 接收 从 机 响应 。 在 SD 协议 中 所 定义 的 命令 集 包含 无 响应 广播 命令 (Broadcast Command，BC) 、 带 响应 广播 
命令 (Broadcast Command with Response，BCR) 、 不 带 数据 传输 定向 命令 (AC，Addressed Command) 、 带 数据 传输 定向 命令 
(ADTC，Addressed Data Transfer Command) 四 种 类 型 。 不 同 功 能 类 型 的 从 机 设备 ， 与 主 控制 器 通信 时 所 支持 的 命令 集 包 含 的 具体 命令 略 有 不 同 ， 但 所 
有 命令 格式 都 相同 。 命 令 格式 如 图 5-24 所 示 。 


传输 位 : “1” 表 示 命 令 





命令 内 容 : 命令 与 地 址 
信息 或 参数 7 位 CRC 码 结束 位 ， 总 


| pl 


开始 位 ， 总 为 “0” 
~ 


CONTENT 


总 长 度 =48 位 





图 5-24 命令 格式 


对 于 命令 类 型 为 BCR、AC、ADTC 的 命令 ， 需 要 从 机 返回 响应 。SD 协 议 规定 了 多 种 响应 类 型 ， 分 别 用 R1、R2、R3、R4、R5、R6、R7 表 示 。 按 响应 长 度 
分 48 位 和 136 位 两 种 格式 ， 如 图 5-25 所 示 。 


se 回复 内 容 ， 命 令 镜像 及 状态 信息 〔R1 回 复 类 型 )， 







到 主 控制 器 OCR 寄存 器 值 (R3 回 复 类 型 ) 或 是 RCA (R4 和 R5 
i 回复 类 型 ) ， 后 带 7 位 CRC 检 验 位 结束 位 ， 国 
起 台 位 ， 加 | 定 为 A 
定 为 a | 
RR PI co | exe Ti 
总 长 48 位 结束 位 ， 国 


2 CONTENT-CID or CSD ee Tr 





总 长 136 位 


图 5-25 ”响应 格式 


2) SD 协议 数据 格式 。 
根据 SD 协议 规定 ，SDIO 接 口上 的 数据 有 普通 数据 格式 和 长 位 这 数 据 格式 两 种 ， 在 DDR 数 据 传输 模式 下 ， 还 有 DDR 数 据 格式 。 


普通 数据 格式 : 数据 以 字 节 (8 位 ) 为 单位 进行 传输 ， 数 据 格式 如 图 5-26 所 示 。 在 该 数据 格式 中 ， 数 据 从 低 字 节 (LSB) 开始 传输 ， 但 在 每 一 字 节 传输 过 
程 中 ， 先 传输 字 节 的 最 高 位 (MSb) 。 根 据 使 用 数据 线 宽 的 不 同 又 分 为 1 位 模式 、4 位 模式 和 8 位 模式 三 种 。 


当 命令 中 断 传输 后 ， 









数据 序列 结束 位 固定 为 “1” 
i 低 字 节 高 字 节 
RE 
DATO a ee eo ee te 
数据 块 
起 始 位 ， 恩 
人 低 字 节 高 字 节 





人 DER 
DATO |0|b|b6| … |bllbo) … | blpolcRgcla 


a) ] 位 模式 ( 仅 使 用 DATO0 ) 


低 字 节 高 字 节 


pam [ETeT Tm] [ol 1 


DAT2 | 0 | bo | b2 | :: |b | Icc| 1 
DAT! [| 0 | bs | bl| | bs | bl Icec| 1 


DATO | 0|b|lb|l… | nlbolcgcl 1 
块 长 度 x2 


b) 4 位 模式 (使 用 DAT0 ~ DAT3 ) 


低 字 节 高 字 


节 
DAT7 BB b7 | .… | b7 | b7 Wno 


DAT6 
DATs 
i 
DAT? 
DAT? 


DATI ol bl | ... |bl|b CRCIEI 
DATO | 0| bl  _ .… | blb lcRcl 1 


大 长 度 
c) 8 位 模式 (使 用 DAT0 ~ DAT7 ) 


图 5-26 ”普通 数据 格式 


长 位 宽 数 据 格式 : 该 格式 适用 于 ACMD13 及 ACMD5 命 令 ， 用 于 传输 从 机 卡 内 部 状态 寄存 器 数据 。 以 512 位 数据 为 例 ， 其 数据 格式 具体 内 容 如 图 5-27 所 


起 始 1 本 


\ 结束 位 
v 
DAT0 | 0 losiilbsiolosooloso8bs07 .|b4lbslb2 |bilbo crc 1 





块 长 度 512 位 


a) 1 位 模式 ( 仅 使 用 DAT0 ) 


起 始 位 结束 位 


DTA3 i 
DTA2 bl0 | b506 | | bo | tm |cc| 1 
DIA | 0| bso9 | bsos | ~ | YS [rm cc 1 
DTA0 | 0| 8 | 4 | … | wm |w |ce|l 1 


块 长 度 512 位 


b) 4 位 模式 (使 用 DAT0 ~ DAT3 ) 


起 始 位 结束 位 
DAT7 | 0|bsll| |bl5 
DAT6 
DAT 
DAT4 
DA 
DA 
DAT! 
DATO | 0 | bs04 | lg | bo lcRC | 1 


长 度 $12 位 


c) 8 位 模式 (使 用 DAT0 ~ DAT7 ) 
图 5-27 ”长 位 宽 数 据 格 式 


DDR 数 据 格 式 : 在 该 模式 中 ， 在 时 钟 的 上 升 沿 和 下 降 沿 都 对 数据 进行 采样 ， 实 现 双 倍速 率 传输 ， 数 据 格式 如 图 5-28 所 示 。 该 模式 下 的 数据 除了 起 始 位 和 结 
束 位 占 一 个 完整 时 钟 周期 外 ， 有 效 数 据 和 CRC 校 验 位 都 只 占 半 个 时 钟 周期 。DDR 模 式 下 数据 传输 次 序 与 普通 数据 格式 类 似 ， 从 低 字 节 开始 传输 ， 但 从 最 高 位 传 
输 每 一 字 节 ， 不 同 的 是 在 DDR 模 式 下 ， 将 数据 分 成 奇 、 偶 字 节 并 采用 交叉 方式 进行 传输 。 


吃 人 tt tt -tt 


低 字 节 (上 半 字 节 ) ”高 字 节 (下 半 字 节 ) 
低 字 节 +1 高 字 节 +1 


DAT3 


DAT2 


DATI1 


DATO 





a) 4 位 DDR 模式 


EE I EE NE, EE A 


低 字 节 低 字 节 +1 ”高 字 节 -1 高 字 节 


DAT 0 | (的 | 多 | | Gm | 的 Reap |CRCWCRC 同 | 1 人 来 位 ， 
DAr| i 0 | 0%) | (| ~ | | lkety acimCRcmy| 全 来 位， 
DAT| 下 区 位 0 | 雯 ) | (入 | | Gi | ( 售 lkeiy| |CRCWCRG 同 | 结束 人 

DAr| 下 类 位 0 | 的 ) | 8) | ”| 二 | 向 | CR | GRACECI 1 全 来 位 ， 
DAr| 起 区 人 0 | (十 ) | 3) | | G5) | 向 lkeD| |CRCA CRC 风 | 二 来 位 
DAr| i 0| G5) | | | 05 | el ”lcci 1 SR 
pani| 二 0 | 的 ) | 多 | | 的 | 的 lke) rca crc 1 
DAro| Bf 0 | | | “| | ley) crearcey 1 SR 

FE 














块 长 度 /2 


b) 8 位 DDR 模式 


图 5-28 DDR 模式 下 数据 格式 
3) SD 协议 传输 时 序 。 


SD 总 线 上 的 命令 发 送 、 响 应 接收 及 数据 传输 需要 按照 一 定 的 时 序 进行 。 SD 总 线 上 传输 时 序 按照 数据 传输 特点 划分 为 不 带 数 据 传输 、 读 数据 传输 和 写 数据 
传输 三 大 类 。 


不 市 数据 传输 : 具体 传输 时 序 如 图 ?-29 所 示 ， 整 个 传输 过 程 中 只 进行 命令 发送 及 响应 接收 ， 且 都 通过 CMD 总 线 来 完成 ，DAT 绪 在 整个 过 程 中 都 处 于 无 效 
状态 。 


CMD— ss Bp 0 “5 | 4 









DAT — 


操作 不 需要 啊 应 ) 操作 〈 不 融 数 据 传 输 ) 


TT ee 


图 5-29 无 响应 操作 和 无 数据 传输 操作 


读数 据 传输 : 所 谓 读数 据 操作 是 将 数据 由 从 机 卡 传输 到 主 控制 器 的 过 程 。 读 数据 操作 具体 传输 时 序 如 图 5-30 所 示 。 


| 数据 传输 
从 主 控制 从 卡 到 主 从 卡 到 主 
器 到 卡 控制 器 控制 器 停止 命令 用 于 停止 数据 传输 








图 5-30 ”读音 (多 ) 块 数据 操作 


在 多 块 数据 传输 过 程 中 ， 主 控制 器 对 每 个 数据 块 进行 CRC 校 验 ， 如 果 传 输 正确 ， 接 着 进行 下 一 个 数据 块 的 传输 ， 直 到 主 控制 器 发 送 结束 命令 CMD12， 从 
机 卡 收 到 结束 命令 后 对 CMD12 命 令 进 行 响应 ， 响 应 传输 完成 标志 本 次 多 块 数据 读 操作 完成 。 与 单 块 数据 读 传输 相 比较 ， 多 块 传输 减少 了 每 块 传输 都 上 友 送 命令 
的 过 程 ， 因 此 提高 了 数据 传输 效率 。 


写 数 据 传输 : 所 谓 写 数据 操作 是 将 数据 由 主 控制 器 传输 到 从 机 卡 的 过 程 。 从 机 卡 对 写 入 卡 中 的 数据 进行 CRC 校 验 ， 并 将 验证 结果 通过 DAT[0] 线 返回 给 主 控 
制 器 ， 块 数据 传输 的 结束 也 是 通过 主 控制 器 友 送 结束 命令 CMD12 来 实现 的 ， 具 体 传输 时 序 如 图 5-31 所 示 。 


二 所 制品 ，CR 检测 回 
EF 控制 大 :CRC 检测 蔬 
从 卡 到 人 sl 复 及 忙 状态 

主 控制 各 。 一 停止 命令 用 于 停止 数据 传输 











wm 数据 块 ”CRC 国 人 忙 川 ”数据 块 


单 块 数据 写 操作 


多 块 数据 写 操作 


i 数据 停止 _ 


图 5-31 写 单 (多) 块 数据 操作 
(2) SDIO 卡 硬件 结构 


SDIO 卡 内 部 包含 的 寄存 器 分 为 内 部 固定 寄存 器 和 功能 模块 专用 寄存 器 区 两 类 。 内 部 寄存 器 的 存储 空间 在 SDIO 卡 中 是 固定 分 配 的 ， 存 储 内 容 为 SDIO 卡 基 
本 信息 ， 可 被 任何 控制 器 进行 读 写 操作 ; 功能 模块 专用 寄存 器 区 的 存储 内 容 由 SDIO 卡 制造 商 根据 各 种 功能 模块 的 要 求 分 别 定义 。 包 含 多 个 功能 模块 的 SDIO 卡 
内 部 寄存 器 结构 如 图 5-32 所 示 。 


CIA(Function 0) 


0x000000-0x0000FF 
0x000100-0x0001FF 
0x000200-Ux0002FF 
0x000300-Ux0003FF 


0x000700-0x0007FF nd 16 MB 可 选 CSA 
0x000800-0x000FFF 


Ox001000-0x017FFF 


0x018000-0x01FFFF 





128KB 寄 存 器 空间 (Function 1~7) 


Ox000000-0x01FFFF 特殊 功能 函数 


图 5-32 ”SDIO 卡 内 部 结构 图 


CIA (Common Information Area) 为 通用 |/O 区 域 ， 为 各 功能 模块 的 公用 操作 区 。 控 制 器 可 通过 读 写 操作 命令 访问 CIA 寄 存 器 。CIA 寄 存 器 主要 用 于 各 
个 MO 功能 模块 的 使 能 开局 、 使 能 关闭 ，SDIO 卡 中 断 管 理 ， 程 序 加 载 控制 等 操作 。CIA 寄 存 器 中 还 记录 了 各 功能 模块 的 适用 性 和 传输 要 求 等 信息 。 在 CIA 中 包 
含 卡 公用 控制 寄存 器 组 (Card Common Control Register，CCCR) 、 功 能 模块 基本 寄存 器 组 (Function Basic Register，FBR) 、 卡 信息 结构 (Card 
Information Structure，CIS) 区 三 个 单独 的 寄存 器 组 。 


CSA (Code Storage Area) 为 MO 代码 存储 区 ， 用 于 存储 各 MO 功能 模块 的 软件 代码 。 为 文 持 SDIO 卡 的 “ 即 插 即 用 ”， 卡 中 每 一 个 功能 模块 都 需要 一 块 
存储 区 域 来 存储 驱动 程序 和 应 用 程序 。 考 虑 到 同一 个 SDIO 卡 可 能 插入 不 同 的 主 控制 器 接口 中 ， 这 需要 求 SDIO 卡 必须 为 每 个 功能 提供 几 种 不 同 版 本 的 驱动 程序 
和 应 用 程序 。 为 满足 系统 要 求 ， 方 法 之 一 是 将 这 些 程序 存储 到 SDIO 组 合 卡 中 的 存储 区 域 中 ;， 另 一 种 方法 是 将 这 些 程序 存储 在 SDIO 卡 中 的 CSA 内 ， 控 制 器 通过 
标准 通道 从 CSA 中 加 载 所 需 的 代码 。CSA 是 一 个 单独 的 16MB 存 储 区 ， 包 含 在 FBR 中 ， 可 以 用 CSA 地 址 指针 进行 访问 。 值 得 注意 的 是 ， 每 个 功能 可 能 由 它 自己 
的 CSA 来 支持 。 主 机 在 访问 CSA 之 前 必须 先 确 定 该 功能 是 否 支持 CSA 通 道 。 


(3) SDIO 接 口 状 态 转 换 


SDIO 卡 的 总 线 状 态 转 换 机 制 如 图 5-33 所 示 ， 该 图 表示 了 SD 总 线 状 态 转 换 与 命令 间 的 关系 。 进 行 一 次 数据 传输 ，SD 思 线 依 次 经 过 以 下 状态 : 初始 状态 
(Initialization State) 、 准 备 状态 (Standby State) 、 命 令 状 态 (Command State) 及 传输 状态 (Transfer State) 。 状 态 间 的 转换 由 命令 来 控制 。 


初始 状态 接收 


命令 CMD5、 
CMD3、CMD15 






初始 化 状态 





传输 状态 
(Dat Bus Active) 






执行 完成 
暂停 操作 










CMD52 中 止 
(Dat Bus Active) 
BS=0 CMD15 或 OCR 
ee 韭 活 动 状态 
与 CDM7 中 RCA 匹 配 ， 
CMD53 到 无 效 态 


图 5-33 SD 总 线 状态 转换 示意 图 


33 二 几 记 


主 控 心 刻 是 固态 硬盘 的 大 脑 ， 其 作用 一 是 合理 调配 数据 在 各 个 内 存心 片上 的 负荷 ， 二 是 承担 整个 数据 中 转 ， 连 接 闪存 心 片 和 外 部 主机 接口 。 不 同 的 主 控 心 
片 之 间 能 力 相差 非常 大 ， 在 数据 处 理 能 力 、 算 法 、 对 内 存心 片 的 读 取 写 入 控制 上 会 有 非常 大 的 不 同 ， 直 接 导致 固态 硬盘 产品 在 性 能 上 的 差距 高 达 数 十 售 。 


如 图 5-34 所 示 为 某 SSD 控 制 器 心 片 的 方 框图 。 其 中 包含 多 个 逻辑 模块 ， 外 围 接 口 部 分 和 底层 供电 部 分 我 们 就 不 天 心 了 ， 主 要 看 右 半 边 ， 其 中 8051CPU 通 
过 将 ROM 中 的 Firmware 载 入 IRAM 中 执行 来 实现 SSD 的 数据 |/O 和 管理 功能 。Flash Controller 负 责 向 所 有 连接 的 NAND Flash 心 片 执 行 读 写 任务 ， 每 个 
NAND Flash 心 片 用 8 位 并 行 总 线 与 Flash Controller 上 的 每 个 通道 连接 ， 每 时 钟 周期 并 行 传递 8 位 数据 。Flash Controller 与 Flash 心 片 之 间 也 是 通过 指令 的 方 
式 来 运作 的 ， 地 址 信息 与 数据 信息 都 在 这 8 位 总 线 上 传送 ， 由 于 总 线 位 宽 太 窒 ， 所 以 一 个 简单 的 寻 址 操作 融 需 要 多 个 时 钟 周 期 才能 传送 完毕 。 心 片 容量 越 大 ， 
地 址 也 就 越 长 ， 寻 址 时 间 也 就 越 长 。 所 以 ， 对 于 小 块 随机 MO，Flash 会 随 着 容量 的 增加 而 变 得 越 来 越 低 效 。 新 的 Flash 心 片 已 经 有 16 位 总 线 的 设计 了 。 总 频率 
目前 一 般 为 33MHz， 最 新 也 有 40MHz 的 。 


1.5V 2.7V Core PHY 
Power On Voltage 3.3V to 1.8V 3.3V to 1.8V 


System SATA IP 


Reset Detector Regulator Regulator Ue OSC 





TxP TxD 





TxN - SATA PHY SATA Ee 8051 ROM | 
RxP Gen MIl Controller CPU 
RN 一 下 1KB IRAM 
xD 
Controller 
Memory 
Flash 0 
Flash 2 
Data Program Data 
Buffer RAM RAM 
Flash 3 





图 5-34 ”Flash 控 制 芯 片 方 框图 


对 于 数据 写 入 来 说 ， 待 写 入 的 数据 必须 经 过 ECC 校 验 之 后 ， 将 数据 和 ECC 校 验 信息 一 并 写 入 心 片 ， 对 于 数据 读 取 来 说 ， 数 据 会 与 其 对 应 的 ECC 信 息 一 起 读 
出 并 作 校 验 ， 校 验 正确 后 才 会 通过 外 部 接口 发 送出 去 。ECC 运 算 器 位 于 Flash Controller 中 。 整 个 SSD 会 有 一 片 很 大 容量 的 RAM (相对 于 机 械 磁 盘 来 讲 ) ， 通 
常 是 64MB 甚 至 128MB。 


与 传统 硬盘 产品 同 质 化 严重 的 情况 不 同 ， 如 今 市 面 上 我 们 能 够 购买 到 的 固态 硬盘 光 是 品牌 就 有 三 十 种 之 多 ， 与 机 械 硬盘 的 三 大 品牌 形成 鲜明 对 比 。 但 是 抛 
开 品 牌 的 光环 ， 这 些 固态 硬盘 的 “ 心 ” 却 是 大 同 小 异 。 目 前 市 面 上 比较 常见 的 固态 硬盘 有 Intel、SandForce、JMicron、Marvell 和 Samsung 等 多 种 主 控 心 
片 。 


目前 主 沉 操 作 系统 都 是 基于 传统 硬盘 的 机 械 特性 设计 的 ， 现 有 文件 系统 无 法 直接 应 用 于 闪存 设备 。 为 了 屏蔽 这 些 问 题 ， 研 究 人 员 提 出 了 FTL 技 术 ， 它 在 文 
件 系统 和 闪存 设备 之 间 加 入 一 个 闪存 转换 层 ， 提 供 块 设备 接口 ， 模 拟 磁盘 块 设备 。 闪 存 转换 层 主 要 提供 了 三 种 功能 ， 即 地 址 映射 、 垃 圾 回收 和 损耗 均衡 机 制 |。 
本 节 仅 介绍 地 址 映射 机 制 ， 垃 圾 回收 和 损耗 均衡 由 于 与 写 平衡 天 系 更 加 密切 ， 因 此 放 人 在 7.2 节 介绍 。 


1. 内 存 转换 层 


闪存 (NAND Flash) 芯片 由 一 定数 目 (通常 为 2048 ~ 16384) 的 闪存 块 (block) 组 成 ， 每 个 块 由 一 定数 目 (通常 为 32 ~ 256) 的 页 (page) 组 成 ,每 
页 的 大 小 一 般 为 2KkB、4KB 或 者 8KB。 闪 存 支持 三 种 基本 操作 ， 即 读 (Read) 、 编 程 〈 写 ，Program) 、 擦 除 (Erase) 。 相 对 于 传统 磁盘 ， 闪 存 必 片 具有 如 
下 独特 的 物理 性 质 : 


1) 不 能 重复 写 (write-once) 。 闪 存 编程 操作 和 擦 除 操作 的 最 小 单位 不 一 致 ， 闪 存 读 、 写 操作 的 基本 单位 是 页 ， 而 擦 除 操作 的 基本 单位 是 块 。 在 写 操作 
之 前 必须 先 执行 擦 除 操作 (erase-before-write) 。 


2) 不 可 原 地 更 新 (out-of-place update) 。 由 于 闪存 在 编程 之 前 必须 擦 除 的 物理 特性 ， 闪 存 中 的 数据 若 要 实现 原 位 置 更 新 (in-place update) 必须 先 
将 整个 块 内 的 有 效 页 的 数据 读 出 ， 擦 除 此 块 后， 再 将 有 效 页 的 数据 与 更 新 后 的 数据 写 回 此 块 ， 这 将 导致 写 放 大 (Write Amplification) 。 因 此 闪存 中 的 数据 采 
用 非 原 位 更 新 ， 即 更 新 数据 时 ， 只 是 将 新 数据 写 到 一 个 新 的 空 闪 页 中 ， 然 后 将 原 数据 所 在 的 物理 页 标记 为 无 效 页 (invalid page) 。 


3) 闪存 内 的 每 一 个 块 的 擦 写 寿命 (program/erase cycle) 都 是 有 限 的 。 通 常 SLC 类 型 的 闪存 中 块 的 擦 写 寿命 是 十 万 次 ， 而 MLC 类 型 的 内 存 中 块 的 擦 写 寿 
命 一 般 只 有 一 万 次 。 


FTL 的 主要 思想 是 把 物理 页 隐藏 起 来 ， 而 把 逻辑 页 呈现 给 操作 系统 ， 由 FTL 提 供 从 逻辑 页 到 物理 页 的 映射 。 如 果 操 作 系统 打算 修改 一 个 页 ， 整 个 页 会 写 到 另 
一 个 干净 的 物理 页 上 ， 原 来 的 页 要 标记 为 无 效 ， 并 更 新 从 逻辑 页 到 物理 页 的 映射 ， 这 个 重 映射 (Remapping) 的 过 程 对 操作 系统 完全 透明 。 同 时 ， 主 控 心 
会 维护 一 个 空闲 块 的 列表 ， 当 需要 新 的 物理 页 时 融 从 这 个 列表 时 分配。 闪存 还 需要 垃圾 回收 机 制 ， 用 来 回收 那些 被 标记 为 无 效 的 页 ， 把 一 个 块 中 有 用 的 页 复制 
到 其 他 地 方 ， 并 把 这 个 块 擦 除 干净 ， 放 到 空间 块 列表 里 。 这 个 重 映射 和 垃圾 回收 的 设计 会 平衡 每 个 块 的 擦 除 次 数 ， 从 而 使 得 传统 的 存储 管理 技术 可 以 直接 应 用 


于 闪存 设备 上 ， 进 而 使 现 有 的 文件 系统 可 以 直接 支持 闪存 设备 上 的 数据 读 取 。 因 此 ，FTL 实 际 上 丈 是 通过 实现 地 址 上 映射、 垃圾 回收 和 损耗 均衡 这 三 大 机 制 ， 将 
内 存 模拟 成 普通 的 块 设备 ， 如 图 5-35 所 示 。 
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Nand Flash 闪 存 


图 5-35 ”闪存 存储 系统 结构 
2. 地 址 映射 


在 闪存 转换 层 中 ， 上 典型 的 地 址 映射 过 程 如 下 : 接收 到 来 自主 机 系统 的 逻辑 页 地 址 ，FTL 束 会 查询 地 址 映射 表 ， 将 逻辑 页 地 址 转换 为 相应 的 物理 页 地 址 。 当 
主机 下 友 重 写 操 作 命令 时 ， 为 了 避免 探 除 操作 ，FTL 会 重新 为 此 逻辑 地 址 分 配 一 个 干净 的 物理 地 址 ， 并 把 原来 的 物理 地 址 标记 为 无 效 。 在 重 写 操作 过 后 ，FTL 会 
更 新 映射 表 信息 ， 使 用 过 的 “ 脏 ” 块 (无效 数据 ) 也 会 通过 垃圾 回收 进行 探 除 。 


按照 映射 信息 的 映射 粒度 ，FTL 可 以 在 页 级 、 块 级 或 混合 级 实现 对 映射 表 的 管理 。 
(1) 页 级 映射 
顾名思义 ， 基 于 页 级 映射 的 FTL 映 射 策 略 惑 是 逻辑 页 与 物理 页 一 一 对 应 。 每 一 个 逻辑 页 号 对 应 一 个 NAND Flash 中 的 物理 页 号 。 


早期 的 Flash 存 储 必 片 容量 较 小 ， 每 个 芯片 的 页 数 有 限 ， 所 以 能 够 采用 细 粒 度 的 页 映射 策略 。 这 是 一 种 高 效 灵活 的 映射 方法 ， 地 址 映射 的 最 小 逻辑 单位 是 
页 ， 它 可 以 把 任何 一 个 逻辑 页 映射 到 任意 的 物理 页 ， 每 个 映射 关系 对 应 一 个 映射 条 目 。 由 于 这 个 特点 ， 此 种 映射 方法 不 会 出 现 全 合并 操作 ， 因 此 在 读 写 操作 上 
有 着 良好 的 性 能 表现 。 

图 5-36 是 页 映射 的 一 个 例子 。 在 这 个 例子 中 ， 假 设 一 个 Block 由 4 个 Page 组 成 。 如 果 有 16 个 逻辑 页 ， 那 么 对 于 映射 表 数 就 是 16。 当 文件 系统 下 发 一 
个 “W7” 的 命令 (即将 数据 写 入 到 逻辑 页 LPN (Logical Page Number) =7 中 ) ，FTL 会 先 查 询 映射 表 (逻辑 页 LPN=7 指 向 物理 页 PPN (Physical Page 
Number) =11) ， 根 据 映射 表 将 数据 存 入 PPN=11 的 物理 页 中 。 当 文件 系统 再 次 下 发 一 个 写 操作 还 要 写 到 LPN=7 上 时 ， 因 为 PPN=11 已 经 写 有 数据 ， 在 这 种 
情况 下 ， 由 于 更 新 前 擦 除 ， 所 以 必须 进行 一 次 擦 除 操作 ，FTIL 会 找 一 个 空闲 页 ， 写 入 数据 ， 更 新 映射 表 ， 将 原来 的 物理 页 标记 为 无 效 。 如 果 没 有 空闲 页 ，FTL 就 
会 从 Flash 中 选择 一 个 牺牲 (victim) 块 ， 将 此 块 的 有 效 页 复制 到 一 个 新 块 上 ， 更 新 映射 表 ， 最 后 擦 除 牺牲 块 ， 变 成 空闲 块 备用 。 
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在 RAM 的 页 映射 表 


图 5-36 ”页 映射 算法 


页 级 映射 FTL 的 优点 是 上 层 文 件 系统 可 以 有 效 地 使 用 NAND Flash 的 各 个 物理 块 ， 但 缺点 是 页 级 映射 FTL 需 要 维护 一 个 大 的 地 址 映射 表 ， 这 个 表 与 NAND 
Flash 物 理 页 的 数量 成 正比 。 由 于 FTL 运 行 时 ， 需 要 将 地 址 映射 表 加 载 到 内 存 中 ， 因 此 页 级 映射 FTL 的 地 址 映射 表 会 占据 较 大 的 内 存 (SRAM) 空间 。 例 如 一 个 
16GB 的 NAND Flash 设 备 束 需要 32MB 的 SRAM 空 间 来 缓存 所 有 的 地 址 映射 表 ， 而 且 随 着 NAND Flash 设 备 容量 的 日 益 增 大 ， 昂 贵 的 SRAM 价 格 使 得 拥有 大 容 
量 的 SRAM 是 不 实际 的 。 


为 了 解决 页 级 映射 FTL 需 要 大 容量 内 存 的 缺点 ，Gupta 等 人 [1] 提 出 了 DFTL 方 案 。DFTL 改 进 了 传统 的 页 级 映射 FTL 策 略 ， 通 过 利用 系统 负载 的 时 间 局 部 性 ， 
按 需 选择 在 SRAM 内 存 中 缓存 地 址 映射 表 ， 而 不 是 在 SRAM 内 存 中 缓存 所 有 的 地 址 映射 表 ， 从 而 合理 地 利用 NAND Flash 设 备 上 容量 有 限 的 SRAM 内 存 。 


(2) 块 级 映射 


因为 页 映射 算法 要 求 很 大 的 RAM ， 所 以 它 只 适用 小 型 从 入 式 系统 。 为 了 克服 这 个 缺点 ，Takayuki Shinohara 提 出 了 块 映射 算法 。 块 级 地 址 映射 的 实现 基 
于 逻辑 块 内 的 页 偏 移 和 物理 块 内 的 页 偏 移 的 一 致 性 。 块 映射 算法 里 ， 地 址 映射 表 的 最 小 逻辑 单位 是 块 ， 逻 辑 到 物理 的 映射 表 的 数量 是 Flash 中 块 的 数量 。 在 块 
级 地 址 映射 中 ， 一 个 页 的 逻辑 地 址 被 分 为 逻辑 块 号 和 块 内 偏 移 两 部 分 。 地 址 映射 表 只 保存 逻辑 块 到 物理 块 的 映射 关系 ， 而 逻辑 地 址 的 块 内 偏 移 与 物理 块 内 偏 移 
相同 。 由 于 采用 粗 粒 度 的 映射 ， 映 射 表 显 著 减 少 。 假 如 N 个 页 面 组 成 一 个 块 ， 与 基本 的 页 映射 算法 相 比 ， 块 映射 的 映射 表 数 量 降 低 为 原来 的 I/N ， 使 得 整个 映 
射 表 能 够 完全 存储 在 RAM 中 。 

图 5-37 所 示 是 块 映射 的 一 个 例子 。 假 设 一 个 Block 由 4 个 Page 组 成 ， 当 文件 系统 下 发 命令 “W9”， 人 逻辑 块 地 址 LBN (Logical Block Number) 就 会 通过 
LPN 除 以 每 个 Block 包 含 的 Page 数 计算 得 到 (LBN=LPN/pages per block=9/4=2) ， 查 询 映射 表 项 找到 PBN (Physical Block Number) =2， 并 对 LPN 求 
余 可 以 得 到 偏 移 量 ， 逻 辑 地 址 的 块 内 偏 移 与 物理 块 内 偏 移 相 同 ，Offset=LPN9%pages per block=9%4=1。 
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图 5-37 块 映 射 算法 


块 级 映射 FTL 最 大 的 优点 融 是 地 址 映射 表 小 ， 只 是 页 级 映射 FTL 地 址 映射 表 的 1/64 (假设 每 块 含有 64 页 ) ， 因 此 占用 内 存 少 ， 地 址 解析 简单 ， 对 读 操 作 相 
当 有 效 。 但 块 级 映射 FTL 也 有 明显 的 缺点 ， 由 于 一 个 给 定 的 逻辑 页 只 能 人 存 入 每 一 块 中 特定 的 物理 页 ， 但 NAND Flash 要 求 块 中 按 页 顺序 编程 ， 因 此 造成 存储 空 


间 滔 费 ， 块 内 碎片 增加 ， 而 且 在 执行 数据 更 新 时 ， 需 要 将 所 在 逻辑 块 中 的 有 效 数据 复制 到 其 他 空 亲 块 中 ， 造 成 严重 的 写 放 大 现象 。 由 于 更 新 的 开销 大 ， 块 映射 
策略 只 能 用 在 一 些 简单 的 设备 中 ， 如 一 些 低 端 的 U 盘 。 


(3) 混合 映射 


为 了 解决 页 级 映射 需要 较 大 SRAM 内 全 的 缺点 ， 以 及 块 级 映射 写 放大 的 缺点 ， 混 合 映射 FTL 的 策略 被 引入 : 同时 使 用 页 级 映射 和 块 级 映射 ， 即 大 多 数 块 作 
为 数据 块 ， 用 于 存储 用 户 数 据 ， 使 用 块 级 映射 ， 而 一 小 部 分 块 作为 日 志 块 ， 用 来 记录 数据 块 中 页 的 更 新 ， 使 用 页 级 映射 。 当 接收 到 由 上 层 系 统 友 来 的 写 请 求 
时 ,数据 先 被 写 入 日 志 块 ， 如 果 日 志 块 中 没有 空闲 页 时 ， 则 将 日 志 块 中 的 有 效 页 更 新 到 对 应 的 数据 块 中 ， 这 个 操作 称 为 日 志 块 与 数据 块 的 合并 操作 。 因 此 , 日 
志 块 的 应 用 使 得 FTL 不 必 执 行 由 于 写 放 大 市 来 的 大 量 的 复制 重 写 操作 。 混 合 映 射 结合 了 页 级 和 块 级 映射 策略 的 优势 ， 既 保证 数据 更 新 的 灵活 性 ， 又 减 小 了 
SRAM 的 压力 。 如 图 5-38 所 示 。 
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图 5-38 ”混合 映射 算法 


NFTL 是 第 一 个 实用 的 适用 于 闪存 的 混合 映射 FTL 算 法 。NFTL 把 所 有 的 块 划分 成 两 类 : 数据 块 和 日 志 块 。 数 据 更 新 采用 原 位 更 新 ， 当 第 一 次 写 入 数据 时 ， 
从 映射 表 碍 询 到 逻辑 到 物理 的 对 应 的 块 号 和 页 侦 移 量 ， 然 后 写 入 数据 ， 当 要 更 新 此 逻辑 地 址 的 数据 时 ，NFTL 会 再 分 配 一 个 空 采 块 作为 替换 块 ， 在 相同 的 页 含 
移 位 置 更 新 数据 ， 将 原来 的 数据 标记 无 效 ， 再 次 更 新 ， 以 此 类 推 。 如 图 5-39 所 示 ，Data Block A 后 面 有 三 个 日 志 块 。Data Block A 的 更 新 数据 必须 写 到 日 志 
块 中 ， 并 且 偏 移 量 要 相同 。 更 新 的 数据 是 顺序 写 入 日 志 块 链 中 的 ， 如 图 5-39 所 示 ， 更 新 数据 时 ，Data Block A 的 第 一 个 页 面 的 有 效 数 据 写 在 Log Block Y 中 ， 
并 将 Log Block X 第 一 页 的 数据 标记 为 invalid， 如 果 此 页 要 重新 写 入 ， 更 新 数据 将 会 写 在 Log Block Z 的 第 一 个 页 ， 然 后 将 Log Block Y 的 第 一 页 的 数据 标记 为 
invalid。 如 果 没 有 空闲 块 进行 数据 更 新 时 ， 主 控 心 片 会 重新 分 配 新 的 日 志 块 继续 链接 在 后 面 ， 其 他 页 的 更 新 以 此 类 推 。 在 进行 回收 时 ， 只 需 将 所 有 的 有 效 数 据 
复制 到 最 后 一 个 日 志 块 ， 然 后 将 其 他 数据 标记 无 效 ， 并 进行 擦 除 。 
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图 5-39 ”NFTL 策 略 


图 5-40 给 出 NFTL 算 法 的 映射 实例 。NFTL 算 法 是 在 一 个 物理 块 上 再 映射 一 个 虚拟 块 。 映 射 表 会 为 一 个 逻辑 块 (LBN) 映射 两 个 物理 块 ， 一 个 叫 作 主 物理 块 
(PPBN) ， 另 一 个 叫 作 蔡 代 物 理 块 (RPBN) 。 访 间 的 逻辑 页 号 LPN=7 除 以 每 个 块 的 页 数 4， 计 算得 到 逻辑 块 LBN=1， 偏 移 量 Offset=LPN%4=3， 知 道 了 偏 
移 量 则 可 以 从 物理 块 上 取得 物理 页 。 如 果 目 标 物理 页 是 无 效 的 ， 则 会 转向 替代 物理 块 寻找 有 效 页 。 然 而 ， 当 文件 系统 对 同一 个 逻辑 地 址 多 次 下 发 写 命令 时 ， 丈 
会 造成 相当 多 的 页 的 搬移 和 块 擦 除 操作 ， 性 能 下 降 明显 。 
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图 5-40 NETL 算 法 
近 些 年 来 ， 学 术 界 相继 又 提出 了 多 种 混合 映射 FTL 策 略 。 


为 了 提高 物理 空间 的 利用 率 ，J.Kim 对 NFTL 进 行 了 改进 ， 提 出 了 BAST (Block Associative Sector Translation) 算法 。 该 算法 为 每 个 数据 块 分 配 一 个 替换 
块 或 者 日 志 块 ， 当 有 更 新 操作 时 ，FTL 取 一 个 空 闪 块 分 配给 该 逻辑 地 址 ， 更 新 数据 写 入 到 该 空 闪 块 中 ， 实 现 逻 辑 到 物理 的 映射 ， 后 面 凡是 对 该 数据 块 的 更 新 操 
作 都 顺序 写 入 该 蔡 换 块 中 ， 直 至 该 块 无 空 内 页 可 用 。 数 据 更 新 时 ， 原 来 数据 块 的 原始 数据 标记 为 invalid， 蔡 换 块 的 更 新 数据 标记 为 valid， 蔡 换 块 写 满 
时 ，BAST 算 法 将 数据 块 和 替换 块 的 有 效 数 据 复 制 到 新 的 数据 块 中 ， 然 后 再 为 新 的 数据 块 分 配 一 个 蔡 换 块 。 


图 5-41 为 数据 块 A 和 B， 它 们 各 自 对 应 一 个 替换 块 。 数 据 块 A 中 的 第 一 、 第 二 页 面 已 经 修改 过 ,顺序 写 入 到 替换 块 中 。 如 果 还 有 页 面 的 更 新 操作 ， 则 会 写 到 
蔡 换 块 的 第 三 个 页 面 。 数 据 块 B 的 替换 块 已 经 写 满 并 没有 空 内 页 ， 如 果 还 有 更 新 操作 则 需要 合并 数据 ， 重 新 分 配 蔡 换 块 。 只 有 在 蔡 换 块 写 满 时 才 会 进行 数据 合 
并 ,合并 时 所 有 的 页 面 都 被 写 过 ， 从 而 没有 空间 浪费 。 但 是 如 果 数 据 块 中 的 更 新 操作 筷 是 来 自 不 同 数 据 块 时 ， 要 经 常 友 生 块 的 替换 ，3 引 | 友 块 拌 动 问题 ， 导 致 蔡 
损 块 利用 率 很 低 。BASsT FTL 浊 V 合 映射 的 策略 是 一 个 数据 块 专用 1 个 日 志 块 ， 这 导致 随机 写 性 能 较 差 ,日 志 块 的 利用 效率 比较 低 ， 垃 圾 回收 时 合并 操作 的 系统 开 
销 大 。 


Data Block A Log Block Data Block B Log Block 





图 5-41 BAST 策 略 


FAST FT 混合 映射 的 策略 是 日 志 块 可 被 所 有 的 数据 块 共享 ， 相 较 于 BAST FTL，FAST FTL 提 高 了 日 志 块 的 利用 率 。FAST (Fully-Associative Sector 
Translation) 是 BAST 的 改进 ， 主 要 目的 是 克服 BAST 的 低空 间 利用 率 问 题 和 块 拌 动 问题 。FAST 和 BAST 很 相似 ， 前 者 允许 所 有 数据 块 都 共享 蔡 换 块 ， 并 把 蔡 换 
块 分 成 两 部 分 ， 一 部 分 用 于 小 颗粒 的 随机 写 (RW) ， 另 一 部 分 用 于 顺序 写 (SW) 。 由 于 实际 写 操作 中 往往 有 大 量 的 顺序 写 ， 所 以 FAST 设 计 了 专门 的 蔡 换 块 
进行 顺序 写 ， 而 组 相 联 的 蔡 换 块 专门 用 于 小 粒度 的 随机 写 ， 为 两 种 蔷 换 块 保留 独立 的 页 映射 表 。FAsT 的 数据 块 可 以 映射 所 有 的 替换 块 ， 写 操作 因为 这 种 灵活 


的 映射 方式 能 够 很 快 响应 。 但 是 ， 正 是 因为 采用 全 相 联 映射 方式 ， 使 每 个 数据 块 对 应 多 个 蔡 换 块 ， 每 个 蔡 换 块 对 应 多 个 数据 块 。 垃 圾 回收 时 ， 每 回收 一 个 蔡 换 
块 ， 丈 要 合并 很 多 数据 块 。 如 果 一 个 块 包含 32 个 页 ， 一 个 替换 块 理论 上 最 多 对 应 32 个 数据 块 。 这 个 替换 块 的 回收 需要 迁移 32 个 数据 块 ， 并 且 擦 除 33 个 块 , 巨 
大 的 开销 市 来 的 延 时 效应 显然 是 用 户 无 法 接受 的 。 因 此 ，FAsT FTL 不 能 容纳 多 顺序 流 ， 也 不 对 随机 流 中 的 时 间 局 部 性 (temporal locality) 提供 特殊 机 制 。 


SuperBlock FTL， 即 超级 块 FTL 混 合 映射 的 策略 是 利用 系统 块 级 别 负 载 的 空间 局 部 性 (spatial locality) ， 把 连续 的 逻辑 块 合 并 成 超级 块 ， 在 超级 块 中 应 
用 页 级 映射 ， 并 利用 请 求法 中 的 时 间 局 部 性 ， 分 离 超级 块 中 的 hot 和 cold 数 据 ( 即 依据 数据 的 更 新 频率 划分 ) 。 但 是 SuperBlock FTL 利 用 了 三 级 地 址 映射 ， 导 
致 需要 多 次 对 每 一 页 的 扩展 区 域 进行 读 写 ， 并 且 SuperBlock FTL 利 用 的 是 固定 大 小 的 超级 块 ， 而 不 是 随 负载 请 求 的 变化 而 调整 ， 使 得 SuperBlock FTL 不 够 灵 
活 。 

LAST FTL 混 合 映射 的 策略 是 为 了 解决 FAST FTL 的 不 足 ， 提 供 了 多 个 顺序 日 志 块 ， 并 利用 了 负载 的 空间 局 部 性 。LAST FTL 进 一 步 将 随机 日 志 块 分 为 hot 和 


cold 区 域 ， 来 减少 合并 操作 市 来 的 系统 开销 。LAsT FTL 依 靠 外 部 位 置 检测 机 制 来 提供 此 动态 分 离 ， 但 作者 也 意识 到 位 置 检 测 不 能 在 小 型 数据 写 操作 时 有 效 地 识 
别 顺序 写 请 求 ， 而 且 用 块 级 映射 表 来 保存 顺序 日 志 块 ， 需 要 把 顺序 流 分 配 到 日 志 块 的 起 始 页 ， 以 此 来 执行 交换 合并 ， 导 致 动态 变化 的 请 求 流 受到 限制 的 问题 。 

Park 提 出 了 SAST 策 略 ， 将 数据 块 和 替换 块 划分 成 组 ， 特 定 的 数据 块 组 只 能 与 特定 的 替换 块 组 进行 映射 ， 以 克服 这 一 缺陷 。SuperBlock FTL 则 将 每 个 日 志 
块 对 应 的 数据 块 数 限制 在 K 个 以 内 。 除 了 这 些 ， 还 有 其 他 混合 算法 。 前 面 的 混合 映射 策略 都 是 以 块 映射 为 基础 的 ，CFTL 是 一 种 以 页 映射 为 基础 的 混合 映射 策 
略 。 进 行 数据 写 入 时 ，CFTL 按 照 页 映射 的 方式 将 数据 写 入 任意 物理 页 中 ;进行 数据 读 取 时 ，CFTL 及 用 块 映射 策略 进行 映射 。 页 映射 保证 了 灵活 性 ， 块 映射 降 
低 了 内 存 消 厅 ， 使 系统 响应 更 快 ， 降 低 l/O 延 迟 。 但 是 ，CFTL 实 现 复 杂 。 它 维护 了 两 种 映射 表 ， 地 址 解析 复杂 ， 并 需要 特定 的 机 制 来 检测 读 密 集 型 的 数据 ， 从 
而 决定 哪些 数据 需要 合并 。 


下 面 比较 三 种 类 型 映射 算法 的 转换 需求 。 其 中 映射 策略 的 映射 表 均 缓存 在 SRAM 中 ， 表 5-4 显 示 了 三 种 地 址 映射 技术 的 内 存 要 求 ， 为 了 方便 理解 ， 本 文 使 
用 128MB 的 小 型 块 闪存 来 计算 映射 表 信息 需求 。 以 128MB 为 单位 的 小 型 块 内 存 有 8192 块 ， 每 块 由 32 个 页 组 成 。 三 字 节 代表 一 个 页 映射 表 的 大 小 ， 而 在 块 喘 
射 ， 只 需要 二 字 忆 来 表示 块 映射 表 大 小 。 混 合 映 射 需要 二 字 节 代表 块 号 和 一 字 节 代表 偏 移 量 。 显 然 ， 块 映射 需要 最 小 的 SRAM， 混 合 映 射 次 之 ， 页 映射 需求 最 
大 ， 


表 5-4 地址 转换 需求 


映射 表 RAM 的 消耗 量 
页 3B x 32 x 8192=768KB 
混合 2B x 8192+1B x 32 x 8192=272KB 


FTL 的 垃圾 回收 与 使 用 均衡 机 制 在 第 7 章 容错 与 写 平衡 中 重点 介绍 ， 这 里 束 不 再 过 多 袭 述 。 


5.4 缓存 


SSD 上 的 缓存 一 般 都 是 由 1 或 者 2 颗 DRAM 内 存心 片 构成 ， 起 到 数据 交换 缓 ; 中 作用 。 一 款 SSD 产 品 是 否 有 缓存 这 样 的 设计 ， 往 往 是 厂商 根据 产品 定位 和 用 途 
作 得 决定 ,一般 一 些 入 门 级 产品 或 者 低速 产品 在 设计 上 束 会 考虑 不 市 绥 存 方案 ， 而 一 些 高 速 产品 由 于 数据 交换 量 大 就 设计 有 缓存 ， 以 提高 产品 的 读 写 效率 。 


通常 带 有 缓存 的 SSD 在 价格 上 比 不 市 缓存 的 略 高 一 些 ， 虽 然 SSD 市 缓存 读 取 小 文件 的 速度 会 快 些 ， 但 对 SSD 来 滴 ， 太 有 限 了 。 束 反应 速度 来 说 ，SSD 的 反 
应 速度 一 般 都 在 0.2 毫 秒 以 内 ， 不 比 缓存 慢 ， 所 以 市 缓存 对 读 取 速度 的 提升 几乎 可 以 忽略 。 其 次 市 不 带 缓 存 并 不 影响 SSD 的 寿命 ， 决 定 SSD 寿 命 的 是 NAND 
Flash 的 写 入 次 数 。 最 后 ， 主 控 心 片 的 好 坏 才 是 决定 SSD 性 能 和 使 用 寿命 的 重要 因素 。 


5.5 ”内 和 存 接 口 


本 节 所 指 的 闪存 接口 是 指 NAND Flash 心 片 与 主 控 心 片 之 间 的 接口 。 当 初 ， 由 于 各 Flash 心 片 生产 厂家 的 生产 工艺 与 技术 不 同 ， 它 们 之 间 的 产品 存在 着 一 定 
的 差异 ， 最 大 的 差异 就 是 存储 芯片 的 接口 标准 。 这 就 使 得 市 场 上 销售 的 NAND Flash 忌 片 在 引 脚 定义 上 不 完全 相同 ， 造 成 为 一 家 公司 设计 的 控制 器 很 有 可 能 无 
法 用 在 另 一 家 公司 的 产品 上 。 比 如 为 东 艺 必 片 设计 的 控制 器 ， 残 无 法 用 人 在 三 星 或 海 力士 的 产品 上 ， 这 融 给 上 游 的 主 控 设 计 商 以 及 最 终 的 产品 设计 人 员 市 来 很 大 
的 困难 。 为 此 ，lntel 联 合 多 家 NAND Flash 厂 商 制定 了 ONFI 标 准 ， 统 一 NAND Flash 芯 片 的 引 脚 定义 ， 并 在 此 基础 上 采用 新 的 技术 以 实现 新 的 功能 。 而 以 三 星 
和 东芝 阵营 为 首 的 NAND Flash 上 商 当 前 所 主打 的 则 是 Toggle 接 口 规 萎 。 下 面 分 别 简要 介绍 ONFI 规 范 和 Toggle 接 口 规范 。 


1.ONFHI 


ONFI (Open NAND Flash Interface， 开 放 式 NANDI 存 接口 ) 规范 是 一 种 Flash 内 存 接口 的 标准 ， 它 是 Intel 为 统一 当初 混乱 的 内 存 接口 所 倡导 的 标 
准 。 


ONFI1.0 制 定 于 2006 年 12 月 ， 内 容 主 要 是 制定 内 存 的 物理 接口 、 封 滚 、 工 作 机 制 、 控 制 指令 、 寄 存 器 等 规范 ， 增 加 对 ECC 的 支持 ,传输 市 完 从 传统 的 
Legacy 接 口 的 40MB/s 提 升 到 50MB/s， 性 能 提升 幅度 不 大 ， 不 过 其 主要 目的 还 是 统一 闪存 接口 规范 ， 减 轻 产 品 厂商 的 开发 压力 。 


ONF12.0 标 准 诞生 于 2008 年 2 月 ，2.0 标 准将 市 完 速 度 提高 到 133MB/s 以 满足 高 速 设备 对 闪存 性 能 的 需求 。 在 该 版 本 中 ， 主 要 是 通过 两 项 技术 来 提高 传输 速 
度 。 第 一 项 束 是 在 DRAM 领 域 里 党 用 的 DDR 信 号 技术 ;第 二 项 是 使 用 源 同步 时 钟 来 精确 控制 锁 存 信号 ， 使 其 能 够 达到 更 高 的 工作 频率 。 


ONFI2.1 标 准 于 2009 年 1 月 友 布 ， 市 宽 提升 到 166MB/s 和 200MB/Ss (工作 模式 不 同 则 速度 不 同 ) ，8KB 的 页 数据 传输 延 时 降低 ， 改 良 电源 管理 ， 降 低 写 入 
操作 能 耗 ， 加 强 ECC 纠 错 能 力 ， 新 增 “Small Data Move” 与 “Change Row Address” 指 令 。 


ONFI2.2 发 表 于 2009 年 10 月 ， 增 加 了 LUN (逻辑 单元 号 ) 重 置 、 增 强 页 编程 寄存 器 的 清除 和 新 的 1CC 测 量 和 规范 。LUN 重 置 和 页 编程 寄存 器 清除 提升 了 拥 
有 多 个 NAND 内 存心 片 设 备 的 处 理 效率 ，ICC 规 范 则 简化 了 下 游 厂 家 的 测试 程序 。 


ONFI2.3 在 2010 年 8 月 的 闪存 峰会 上 发 布 ， 在 2.2 标 准 的 基础 上 加 入 了 EZ-NAND 协 议 。EZ-NAND 是 Error Zero NAND 的 简写 ， 这 一 协议 将 NAND 闪 存 的 
纠 错 码 管理 由 主 控 心 片 转移 到 闪存 自身 ， 以 减轻 主 控 必 片 负担 。 


ONFI3.0 规 学 在 2011 年 3 月 发 布 ， 通 过 使 用 非 易 失 性 DDR2 接 口 (NV-DDR2) ，NAND 闪 人 存 接口 的 传输 速度 得 以 翻番 ， 达 到 400M B/s， 同 时 继续 保持 向 下 
兼容 。ONFI13.0 标 准 详细 规定 了 NAND 闪 存 的 最 新 接口 、 基 础 架构 定义 。 接 口 速 度 翻 一 番 之 后 ，NAND 闪 存 控制 器 今后 只 需要 一 半数 量 的 通道 就 能 获得 同样 的 
性 能 ， 从 而 大 大 节约 成 本 和 产品 体积 ， 特 别 有 利 于 固态 硬盘 的 推广 和 普及 。 新 标准 增加 了 差分 信号 技术 ， 可 控制 电压 拨 动 、 节 省 功 耗 ， 并 且 内 核 选择 (die 
selection) 技术 能 够 减少 芯片 选 通 (chip enable) 所 需要 的 针脚 数量 ， 进 而 减少 控制 器 的 针脚 数 ， 提 高 PCB 布 线 效率 。 这 同样 有 助 于 固态 硬盘 降低 成 本 ， 同 
时 还 能 让 更 多 针脚 分 配给 其 他 系统 任务 。 


ONFI4.0 规 范 在 2014 年 4 月 发 布 。ONFI4.0 引 入 了 下 一 代 高 速 接 口 NV-DDR3， 使 得 最 大 传输 速度 提高 到 800MB/s。 此 外 ，ONFI4.0 还 降低 了 接口 的 功 耗 ， 
接口 电压 从 NV-DDR2 的 1.8V 降 低 到 1.2V。 


ONFI 规 范 定义 了 之 后 ， 对 于 各 家 厂商 的 NAND Flash， 只 要 符合 这 个 ONFI 规 范 ， 上 层 NAND Flash 的 软件 就 可 以 统一 只 用 一 种 了 ， 换 句 话 说 ， 写 了 一 份 
NAND Flash 的 驱动 后 ， 就 可 以 操作 所 有 与 ONFI 兼 容 的 NAND Flash 了 ， 整 个 NAND Flash 的 兼容 性 、 上 层 软件 的 兼容 性 、 互 操作 性 就 大 大 提高 了 。 由 于 任何 
规范 在 定义 的 时 候 都 会 考虑 到 兼容 性 和 扩展 性 ，ONFI 也 不 例外 。 针 对 符合 ONFI 规 范 的 写 好 的 软件 ， 除 了 可 以 操作 多 家 与 ONFI 兼 容 的 NAND Flash 之 外 ， 对 
于 以 后 出 现 的 新 的 技术 ， 新 制程 的 NAND Flash， 只 要 符合 ONFI 规 范 ， 也 同样 可 以 支持 、 可 以 在 旧 的 软件 下 工作 ， 而 不 需要 由 于 NAND Flash 的 更 新 换代 ， 而 
更 改 上 层 软件 和 驱动 。 


2.Toggle 


面 对 ONFI 组 织 的 攻势 ， 占 有 全 球 70%NAND 产 能 的 两 大 闪存 生产 巨头 三 星 与 东芝 决定 携手 对 抗 ，2007 年 12 月 ， 三 星 与 东芝 联合 通过 了 一 项 关于 闪存 专利 
技术 互 换 授 权 协 议 ， 根 据 这 项 协议 ， 三 星 电 子 和 东芝 在 闪存 规格 和 技术 上 将 完全 共享 。 根 据 协议 规定 ， 三 星 将 允许 东芝 生产 和 制造 自己 旗下 的 OneNAND 和 
Flex-OneNAND 闪 存 芯片 ， 而 东芝 公司 则 将 自己 的 LBA-NAND 和 mobile LBA-NAND 闪 存 芯 片 技术 作为 条 件 与 三 星 电 子 进行 交换 ， 这 些 闪 存 芯 片 生 产 技术 都 
是 三 星 电子 和 东芝 的 核心 扶 术 ， 但 是 新 的 合作 协议 让 双方 在 闪存 芯片 制造 技术 实力 上 都 取得 了 进一步 的 增强 ， 此 外 他 们 将 一 同 合作 研发 新 一 代 闪 存 产品 ， 也 就 
是 后 来 的 Toggle DDR NAND 闪 存 。 


2010 年 6 月 三 星 与 东芝 开始 投产 符合 Toggle DDR1.0 接 口 标准 的 NAND 内 存 ，Toggle DDR NAND 采 用 双向 DQS 信 号 控制 读 写 操作 ， 信 号 的 上 升 与 下 降 沿 
都 可 以 进行 资料 的 传输 ， 能 使 传输 速度 翻 倍 ， 接 口 市 宽 为 133MB/s， 而 且 没 有 内 置 同步 时 钟 友 生 器 ( 即 NAND 还 是 异步 设计 ) ， 因 此 其 功 耗 会 比 同步 NAND 
更 低 。2010 年 8 月 ， 最 新 的 Toggle DDR2.0 接 口 标准 发 布 ， 传 输 带 宽 上 升 到 400MB/s， 目 前 网 上 关于 此 标准 的 详细 消息 还 不 多 ， 不 过 可 以 确定 的 是 技术 指标 与 
ONF13.0 是 类 似 的 。 


3.ONFI 与 Toggle 的 区 别 
Ts ENAND Elosh TogglebDe aInters Micronssiy ONEI DA se es TA lal 
1) Toggle 同 步 模式 下 不 用 Clock， 写 数据 用 DQS 差 分 信号 跳 变 沿 触 友 ， 读 数据 用 Host 发 的 REN 差 分 信号 跳 变 沿 触 发 读 请 求 ，DQS 跳 变 沿 输出 数据 。 


2) ONFI 同 步 模 式 下 有 Clock， 数 据 、 命 令 、 地 址 都 要 与 Clock 同 步 。 但 是 DQS、Clock 都 不 是 差分 信和 号， 所 以 边沿 容易 受 干扰 。ONFI3.0 里 面 有 NV 
DDR2 模 式 ， 就 与 Toggle 一 样 了 ,不 再 用 Clock， 用 DQS 和 REN 差 分 信号 。 
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第 6 章 ”固态 仔 储 文件 系统 


Flash 是 当前 主流 的 固态 存储 器 件 ， 它 具有 独特 的 物理 组 成 与 使 用 特性 ， 如 不 能 重复 写 、 编 程 操 作 和 擦 除 操作 的 最 小 单位 不 一 致 、 不 可 原 位 更 新 、 每 一 个 
块 的 探 写 寿命 是 有 限 的 等 。 因 此 ， 现 有 针对 机 械 磁 盘 设 计 的 文件 系统 不 能 直接 应 用 在 Flash 上 ， 需 要 借助 一 个 特殊 的 软件 层 一 一 闪存 转换 层 (FTL) ， 来 屏蔽 内 
人 存 的 底层 差异 ， 使 上 层 系统 可 以 透明 地 使 用 闪存。 不 过 ， 随 着 固态 存储 介质 的 不 断 普 及 和 发 展 ， 近 年 来 出 现 了 很 多 专门 为 内 存 设 计 的 文件 系统 ， 它 们 不 再 需要 
通过 FTL 转 换 也 能 很 好 地 运用 在 内 存 上 。 因 为 这 些 文件 系统 中 已 经 包含 了 FTL 的 各 种 功能 ， 使 得 它们 可 以 运行 在 内 存 上 并 能 直接 操作 闪存 的 物理 存储 空间 ， 减 少 
了 中 间 转 换 环 节 ， 提 高 了 工作 效率 ， 进 一 步 友 挥 了 闪存 的 固有 优势 。 


本 章 首 先 对 固态 存储 文件 系统 的 情况 进行 了 分 类 介绍 ， 随 后 对 当前 主流 的 固态 存储 文件 系统 如 中 FS、YAFFS、UBIFS 和 exFAT， 从 基本 数据 结构 、 文 件 系 
统 的 扫描 与 挂 载 、 内 存 结构 建立 过 程 以 及 垃圾 回收 机 制 等 方面 ， 剖 述 了 它们 的 工作 原理 和 运行 过 程 。 


6.1 概述 


目前 固态 存储 文件 系统 大 致 可 以 分 为 以 下 几 类 : 
1. 只 读 文 件 系统 


比如 RomFS (Rom File System) ，CromFS (Compressed Rom File System) ， 两 者 的 共同 特点 是 不 可 写 ， 适 用 于 小 容量 和 且 只 读 的 闪存， 比如 制作 
initrd 镜 像 。 


2.FTL+ 传 统 文 件 系统 

这 是 指 通过 FTL 中 间 层 ， 使 传统 文件 系统 可 以 适用 于 闪存 。 
3. 日 志 类 型 文件 系统 

下 面 是 一 些 典 型 例子 : 


(1) JFFS/JFFS2 (Journalling Flash File System ) 


JFFS 是 由 瑞典 Axis 公 司 研 发 的 用 于 褒 入 式 系 统 中 闪存 的 文件 系统 ， 其 严格 顺序 存储 的 特点 可 以 天 然 地 解决 损耗 均衡 的 问题 ， 但 也 使 其 垃圾 回收 机 制 (向 日 
志 尾 部 写 入 新 的 节操 以 便 删 除 最 老 的 擦 除 块 ) 存在 严重 的 效率 问题 (比如 文件 系统 中 静态 数据 占 多 数 的 情况 ) ; 趾 FS2 是 RedHat 公 司 基 于 JFFS 开 发 的 文件 系 
统 ， 其 做 了 一 些 关 键 的 改进 ， 比 如 支持 数据 压缩 和 硬 链 接 ， 使 用 概率 算法 和 clean/dirty 擦 除 块 链 表 来 进行 垃圾 回收 和 损耗 均衡 管理 。 


(2) YAFFS/YAFFS2 (Yet Another Flash File System) 


YAFFS 是 新 西 兰 Aleph One 公 司 开发 的 ， 是 第 一 款 专门 为 NAND Flash 制 作 的 文件 系统 。 其 充分 利用 了 NAND Flash 每 个 页 面 的 OOB 空 间 ， 加 强 了 坏 块 管 
理 ， 在 垃圾 回收 机 制 上 采取 了 贫 心 策略 和 随机 选择 结合 的 方法 ， 但 没有 并 入 Linux 内 核 。 


(3) UBIFS (Unsorted Block Image File System) 


UBIFS 是 基于 MTD 和 UBI 之 上 的 文件 系统 ， 由 匈牙利 塞 格 德 大 学 与 芬兰 Nokia 公 司 共 同 开 发 。UBIFS 和 JFFS2 一 样 也 是 基于 节点 的 文件 系统 ， 改 善 了 可 扩展 
性 和 坏 块 管理 ， 已 并 入 2.6.27 版 本 之 后 的 Linux 内 核 。 


(4) LogFS (Linux Log-structured Flash File System ) 


LogFS 主 要 由 J6rn Engel 编 写 ， 作 者 还 包括 Linux 消 费 电 子 论坛 (CE Linux Forum) 。 该 文件 系统 是 在 Linux 上 用 日 志 结 构 来 提升 可 扩展 性 的 一 种 文件 系 
统 ， 主 要 目标 是 大 容量 内 存 设备 。 到 2008 年 11 月 ，LogFS 终 于 能 通过 所 有 测试 案例 ， 表 明 LogFS 已 趋 于 成 就 ， 但 目前 仍 在 开发 中 ,没有 并 入 Linux 内 核 。 


除了 上 述 文件 系统 ，SSD 也 有 专用 的 文件 系统 ， 比 如 美国 Sun 公 司 的 ZFS 和 美国 SanDisk 公 司 的 ExtrremeFFS,， 但 前 者 专用 于 Solaris 操 作 系 统 ， 由 于 许可 证 
的 问题 ， 不 能 顺利 移植 到 Linux; 后 者 是 用 于 SSD 控 制 器 的 软件 ， 不 是 操作 系统 的 一 部 分 。 所 以 这 些 文 件 系统 本 书 不 作 详 细 研 究 。 


内 存 的 主要 特性 包括 擦 除 后 重 写 、 擦 除 单 位 ( 擦 除 块 ) 和 读 写 单位 (页 ) 不一致。 在 闪存 文 件 系 统 中 ， 除 只 读 文件 系统 可 以 不 考虑 内 存 的 一 些 特性 外 ， 其 
他 文件 系统 都 要 考虑 上 述 特性 市 来 的 损耗 均衡 、 垃 圾 回收 、 坏 块 管 理 等 问题 ， 而 且 涉 及 下 面 几 个 磺 层 结构 : 


1) FTL/NFTL， 闪 存 转 换 层 : FTL 屏 贡 了 闪存 的 擦 除 后 重 写 特性 ， 提 供 损耗 均衡 、 垃 圾 回收 和 坏 块 管理 功能 ， 让 闪存 展现 出 块 设备 的 编程 接口 。 


2) MTD (Memory Technology Device) : 为 不 同 种 类 的 闪存 忌 片 提供 统一 的 访问 接口 ， 简 化 了 上 层 软件 的 复杂 性 ， 提 供 了 抽象 的 MTD 和 分 区 。 
JFFS/JFFS2、UBI、YAFFS/YAFFS2、LogFS 都 是 基于 MTD 的 。 


3) UBI (Unsorted Block Image) : 它 是 基于 MTD 之 上 的 软件 层 ， 提供 了 逻辑 卷 管理 工具 (这 个 与 LVM 卷 相似 ) 、 损 耗 均衡 和 坏 块 管理 等 功能 ， 让 上 
层 软件 从 这 些 复杂 事务 中 解脱 出 来 。 


图 6-1 给 出 了 闪存 文件 系统 的 层次 结构 图 。 从 图 中 可 以 看 到 JjFFS2、YAFFS2、LogFS 建 立 在 MTD 基 础 之 上 ，UBIFS 建 立 在 UBI 层 之 上 。 
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图 6-1 闪存 文件 系统 层次 结构 图 


6.2 JFFS2 


JFFS， 是 一 种 可 以 直接 工作 在 NAND Flash 上 的 日 志 结 构 文件 系统 。 牛 FS2 是 在 上 FFs 的 基础 上 发 展 来 的 。 由 于 外 FS2 可 以 直接 工作 企 NAND Flash 上 ， 因 此 
与 传统 磁盘 文件 系统 相 比 ，JFFS2 可 以 在 很 大 程度 上 提高 NAND Flash 的 读 写 效率 ， 本 节 主 要 对 JFFS2 文 件 系统 进行 介绍 。 


6.2.1 主要 节 氮 


1. 节 点 头 部 定义 


JFFS2 中 所 有 类 型 节点 的 头 部 都 相同 ， 均 包括 节点 长 度 、 节 点 类 型 、 节 点 循环 匈 余 码 校 验 以 及 节操 兼容 属性 这 四 个 字段 。 其 中 ， 吓 FS2 有 以 下 几 种 类 型 的 兼 


1) 当 一 个 节点 的 兼容 属性 是 JFFS2_FEATURE_INCOMPAT 时 ， 如 果 引 FS2 不 支持 该 节点 ， 此 时 JFFS2 将 不 能 正常 挂 载 。 
2) 当 一 个 节点 的 兼容 属性 是 JFS2_FEATURE_ROCOMPAT 时 ， 如 果 JFFS2 不 支持 该 节点 ， 此 时 JFFS2 只 能 以 只 读 方 式 挂 载 。 


3) 当 一 个 节点 的 兼容 属性 是 JFFS2_FEATURE_RWCOMPAT _DELETE 时 ， 如 果 JFFS2 不 支持 该 节点 ， 此 时 JFFS2 可 以 以 读 写 方式 挂 载 。 但 是 当 JFFS2 的 垃圾 
回收 机 制作 用 于 该 节点 所 在 的 区 域 时 ， 该 节点 应 该 被 删除 。 


4) 当 一 个 节点 的 兼容 属性 是 jFF32_FEATURE_RWCOMPAT_COPY 时 ， 如 果 JFFs2 不 支持 该 节点 ， 此 时 JFFS2 可 以 以 读 写 方式 挂 载 。 但 是 当 上 FS2 的 垃圾 
回收 机 制作 用 于 该 节点 所 在 的 区 域 时 ， 该 节点 应 该 被 复制 到 新 的 区 域 。 


2.JFFS2 的 数据 节点 


JFFS2 在 Flash 上 主要 存在 两 种 类 型 的 数据 节点 : jffs2 raw_inode 节 点 和 jffs2 raw_dirent 节 点 。 这 两 种 数据 节点 在 JFFS2 挂 载 后 ， 在 内 存 中 都 用 
jffs2 raw_node ref 节 点 来 表示 。 另 外 ，JFFS2 用 jffs2 inode_cache 节 点 来 表示 一 个 文件 。 下 面 将 详细 分 析 上 述 各 个 节点 中 的 主要 字段 以 及 这 些 字段 的 作用 。 


jffs2_raw_inode 节 点 用 来 描述 Flash 设 备 上 的 文件 数据 以 及 文件 的 各 种 元 数据 。 该 节点 主要 有 下 列 字段 : 

1) ino 字 段 : 表示 文件 的 索引 节点 号 。 一 个 文件 一 般 由 多 个 jffs2_raw_inode 节 点 组 成 。 此 时 ， 这 些 jffs2_raw_inode 节 点 中 的 ino 字 上 段 值 都 是 相同 的 。 
2) mode 字 段 : 表示 文件 的 类 型 。 

3) uid 字 段 : 表示 文件 的 拥有 者 。 

4) atime 字 段 、mtime 字 段 、ctime 字 段 : 这 三 个 字段 分 别 表示 文件 最 近 访 问 时 间 、 文 件 最 近 修 改 时 间 、 文 件 创建 时 间 。 


5) compr 字 段 、dsize 字 段 、csize 字 段 : 这 三 个 字段 与 JFFS2 的 压缩 存储 功能 有 关 。compr 字 段 的 值 表示 是 否 对 数据 进行 压缩 存储 。 当 对 数据 进行 压缩 存 
储 时 ，dsize 字 段 表示 压缩 前 的 数据 长 度 ，csize 字 段 表 示 压 缩 后 的 数据 长 度 。 


jffs2_raw_dirent 节 点 表示 JFFS2 中 的 目录 项 ， 用 来 描述 文件 在 JFFS2 中 的 位 置 。 该 节点 主要 有 下 列 字 段 : 

1) pino 字 段 : 表示 jffs2_raw_dirent 节 点 所 属 目录 文件 的 索引 节点 号 。 

2) version 字 段 : 表示 文件 的 版 本 号 。 当 向 Flash 中 的 文件 区 域 写 入 新 的 数据 或 者 修改 已 有 数据 时 ，version 字 段 值 都 将 递增 。 

3) ino 字 段 : 表示 jffs2_raw dirent 节 点 后 文件 的 索引 节点 号 。 

4) nsize 字 段 : 表示 jffs2 raw dirent 节 点 后 的 数据 长 度 。 

上 述 两 种 类 型 的 数据 节点 在 读 入 内 存 后 都 是 用 jffs2 raw_node ref 节 点 表示 。jffs2 raw_node ref 节 点 主要 有 下 列 字段 : 

1) Flash_offset 字 段 : 表示 文件 或 目录 实体 的 物理 地 址 。 

2) totlen 字 段 : 表示 文件 或 目录 节点 之 后 的 数据 忌 长 度 。 

3) next_in_ino 字 段 : 同一 个 文件 的 不 同 数据 节点 将 使 用 该 字段 链接 起 来 。 

4) next phys 字 段 : 在 JFFS2 中 ， 一 个 文件 或 目录 使 用 数据 结构 jffs2 inode_cache 表 示 ， 该 字段 则 是 指向 jffs2 inode_cache 结 构 的 。 


在 JFFS2 中 ，jffs2_inode_cache 节 点 用 来 表示 一 个 文件 或 目录 。 该 节点 主要 有 以 下 成 员 : 


od 


next 字 段 : 在 下 FS2 中 ，jffs2_ inode_cache 结 构 是 通过 散 列 表 方 式 组 织 到 一 起 的 ， 该 字段 是 为 了 解决 散 列 ;中 突 的 ，。 


ND 
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nodes 字 段 : 该 字段 指向 jffs2_raw_node ref 节 点 所 组 成 的 循环 链表 。 从 该 节点 出 发 ， 可 以 遍历 属于 同一 个 文件 的 所 有 jffs2_ raw_node _ ref 结构。 


Ow 
4 


ino 字 段 : 表示 文件 或 目录 的 索引 节操 号 。 这 个 索引 节点 号 在 整个 文件 系统 荡 围 内 是 唯一 的 。 


nlink 字 段 : 表示 文件 的 硬 链接 个 数 。 
另外 ，JFFS2 在 打开 Flash 中 的 文件 时 ， 还 将 在 内 存 中 生成 jffs2 full_ dnode 结 构 体 。 该 结构 各 个 字段 的 值 主要 来 自 jffs2 raw_inode 节 点 中 相应 字段 的 值 。 


在 打开 一 个 文件 后 ，JFFS2 中 主要 数据 结构 间 关 系 如 图 6-2 所 示 。 
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图 6-2 ”打开 文件 后 主要 数据 结构 间 关 系 


其 中 ，jffs2_inode_cache 结 构 表示 打开 的 具体 文件 ，jffs2_raw_inode 结 构 表示 Flash 上 具体 的 文件 数据 ，jffs2_ raw_node _ref 结 构 是 jffs2_raw_inode 结 构 
在 内 存 中 的 表示 ，jffs2 full dnode 结 构 是 在 打开 文件 的 时 候 创建 的 。 


3JFFS2 的 超级 块 和 索引 节点 

JFFS2 中 使 用 jffs2_sb_info 结 构 表示 文件 系统 的 超级 块 。 该 结构 是 在 JFFS2 挂 载 时 创建 的 。jffs2_sb_info 结 构 主要 有 下 列 字段 : 
1) mtd 字 段 : 该 字段 指向 mtd info 结 构 。mtd _info 结 构 中 有 对 Flash 设 备 进行 操作 的 相应 函数 ， 

2) highest_ino 字 段 : 该 字段 的 值 为 jFFS2 中 最 大 的 索引 节点 号 。 

3) flags 字 段 : 该 字段 值 表示 以 何 种 方式 挂 载 文 件 系统 。 


4) gc task 字 段 、gc_ thread start 字段: 这 两 个 字段 与 上 FS2 的 垃圾 回收 机 制 有 关 。 在 上 FS2 中 ， 志 圾 回收 是 通过 一 个 内 核 线程 来 实现 的 。gc_task 字 段 则 
是 指向 该 内 核 线程 ， 而 gc_ thread _start 字 段 是 用 于 保证 该 内 核 线程 在 创建 后 将 及 时 运行 。 


5) clean _list 字 段 、very_dirty list 字段、dirty_list 字 段 、erasable list 字 段 : 根据 擦 除 块 的 不 同 状态 ，JFFS2 将 Flash 上 所 有 的 擦 除 块 保存 在 以 上 各 种 链表 
中 。JFFS2 通 过 使 用 不 同 的 链表 ， 可 以 达到 均衡 使 用 擦 除 块 的 目的 。 


6) blocks 字 段 : 该 字段 指向 jffs2_eraseblock 结 构 。 这 个 结构 是 用 来 表示 Flash 中 探 除 块 的 摘 述 符 。 
JFFS2 的 这 引 节点 是 通过 jffs2_inode_info 结 构 表示 的 。JFFS2 将 为 每 个 打开 的 文件 创建 一 个 索引 节点 。 该 结构 主要 有 下 列 字段 : 


1) sem 字 上段: 该 字段 主要 用 于 实现 读 写 操作 与 垃圾 回收 机 制 间 的 同步 。 


2) highest version 字 段 : 该 字段 表示 同一 个 文件 数据 实体 中 的 最 高 版 本 号 。 


3) inocache 字 段 : 该 字段 指向 打开 文件 的 jffs2 inode _ cache 结构 。 


6.2.2 ” 挂 载 过程 


JFFS2 在 挂 载 的 时 候 ， 将 会 扫描 Flash 上 的 所 有 分 区 。 在 这 个 过 程 中 ， 外 FS2 将 会 为 Flash 上 每 个 表示 数据 实体 的 jffs2_raw_dirent 和 jffs2_raw_inode 结 构 创 
建 jffs2_raw_node_ref 结 构 。 同 时 ，JFFS2 将 会 为 每 一 个 文件 或 目录 创建 一 个 jffs2_inode_cache 结 构 。JFFS2 挂 载 过 程 中 主要 功能 函数 的 调用 流程 如 图 6-3 所 


小 \。 


]ftts2 read_super 


jits2 _ do _ fl super 





Jffs2_do_mount fs 


Jtts2 bulld filesystem 





图 6-3 JEFFS2 挂 载 流程 图 


在 JFFS2 挂 载 时 ， 首 先 调用 jffs2 read _ super 函数 ， 进 行 一 些 必要 检查 和 关键 字段 的 设置 。 接 着 ，jffs2_ read super 函 数 调 用 jffs2 do fil super 函 数 为 
Flash 上 所 有 的 数据 实体 创建 相应 的 数据 结构 ， 并 且 初 始 化 上 层 VFS 超 级 块 super_ block 结构 的 相关 字段 。 


外 FSs2 挂 载 过 程 中 所 需 的 大 部 分 工作 都 是 通过 jffs2 do fill super 函 数 调用 jffs2 do _ mount fs 函数 完成 的 。jffs2 do mount fs 函数 首先 为 Flash 上 所 有 擦 
除 块 创建 相应 的 结构 ， 然 后 初始 化 jffs2_sb_info 结 构 体 中 各 种 链表 的 头 部 。 接 着 ,调用 jffs2_build filesystem 函 数 完 成 上 FS2 挂 载 的 主要 任务 。 


jffs2_build filesystem 孙 数 是 完成 JFFS2 挂 载 工 作 的 具体 辫 数 。 该 溺 数 首先 会 扫描 整个 Flash 区 域 ， 在 这 个 过 程 中 会 为 Flash 上 每 一 个 数据 节点 建立 
jffs2_raw_node _ref 结 构 ， 并 为 每 个 目录 项 创建 jffs2 full_dirent 结 构 。 同 时 ， 为 所 有 普通 文件 或 目录 文件 创建 jffs2_ inode_cache 结 构 。 接 着 ,将 所 有 
jffs2_inode_cache 结 构 加 入 JFFS2 超 级 块 中 的 inocache_list 字 段 所 指向 的 散 列 表 中 ， 并 检查 Flash 所 有 数据 的 有 效 性 。 最 后 根据 Flash 上 不 同 擦 除 块 的 状态 ,将 
其 加 入 jffs2_sb_info 结 构 中 相应 的 各 个 链表 中 。 至 此 ， 上 FS2 挂 载 过 程 结束 。 


6.2.3” 写 文件 过 程 


在 JFFS2 中 ， 与 写 文 件 相 关 的 数据 结构 主要 是 jffs2_file_operation 结 构 和 jffs2_file_address_operation 结 构 。 当 用 户 空 间 友 起 写 文件 操作 
时 ，jffs2 file_operation 结 构 中 的 函数 首先 会 被 调用 ， 然 后 调用 jffs2_file_address_operation 结 构 中 的 函数 ， 以 完成 向 Flash 设 备 中 写 数据 。JFFS2 写 文件 过 程 
中 主要 功能 函数 的 调用 流程 如 图 6-4 所 示 。 


SYS wrlite 


generic file write 


J]ffs2 prepare write 


]fis2 commit wnite 


J]iis2 wmte node range 


jffs2 write_dnode 





图 6-4 JFFS2 写 文件 流程 图 


用 户 空间 发 出 的 系统 调用 ， 首 先 会 通过 函数 sys_write 找 到 指向 文件 node 节 点 的 指针 。 接 着 ，JFFS2 会 调用 jffs2 file operation 结 构 体 中 定义 的 
generic file_ write 函数 。generic file_ write 函数 首先 会 调用 jffs2_prepare_write 函 数 进 行 写 数据 之 前 的 一 些 准 备 工作 ， 接 着 调用 jffs2_ commit_ write 函数 将 指 
定 的 数据 写 入 Flash 设 备 中 。 

jffs2_ commit_ write 函数 首先 会 为 待 写 入 的 数据 创建 一 个 jffs2_raw_inode 结 构 体 ， 并 设置 其 部 分 字段 的 值 。 接 着 ，jffs2_commit_write 国 数 调用 
jffs2_write_inode_range 函 数 将 创建 的 结构 体 写 入 Flash 设 备 中 ， 并 将 数据 写 入 jffs2_raw_inode 结 构 体 之 后 。 在 写 入 数据 之 前 ， 数 据 可 能 会 被 压缩 存储 。 同 
时 ，jffs2 write inode range 函 数 将 会 创建 jffs2 raw_node ref 以 及 jffs2 full dnode 等 各 种 结构 体 ， 并 且 被 组 织 到 相应 的 链表 中 。 


在 jffs2 write inode range 函 数 需要 完成 的 所 有 工作 中 ， 除 去 创建 jffs2 raw inode 结 构 和 将 写 入 的 数据 压缩 之 外 ， 大 部 分 工作 都 是 由 其 调用 
jffs2 write dnode 函 数 来 完成 的 。 在 jffs2 write dnode 函 数 调用 结束 后 ， 整 个 写 操 作 也 就 完成 了 。 


6.2.4 读 文件 过 程 


在 jfFs2 中 ， 读 文件 过 程 与 写 文 件 过 程 类 似 。 当 用 户 空 间 友 起 读 文 件 操作 时 ，jffs2_ file _ operation 结构 中 的 函数 首先 会 被 调用 ， 紧 接 痢 调用 
iffs2 flle address_ operation 结 构 中 的 函数 ， 以 完成 从 Flash 设 备 中 读数 据 。 目 FS2 读 文件 过 程 中 主要 功能 函数 的 调用 沅 程 如 图 6-5 所 示 。 


sys read 


do generic file read 


J]iis2 readpage 


]ffs2 do readpage nolock 








]ffs2 read inode range 


]ffs2 read 





图 6-5 ”JFFS2 读 文件 流程 图 


用 户 空间 的 系统 调用 会 通过 sys_read 函 数 ， 调 用 do_generic file_read 消 数 。 该 遂 数 首先 会 进行 一 些 读 前 的 预 处 理 。 然 后 ，do_generic file_read 消 数 会 通 
过 调用 jffs2_readpage 水 数 完成 将 文件 的 各 个 数据 块 读 到 内 核 缓存 中 。 

jffs2 readpage 国 数 通过 调用 jffs2 do readpage nolock 孙 数 完成 其 读 文 件数 据 的 功能 。jffs2 do readpage nolock 了 水 数 通 过 调用 
jffs2_read_inode_range 函 数 ， 将 Flash 设 备 上 的 一 页 数据 读 到 JFFS2 的 内 核 缓存 中 ， 并 且 在 读 操作 完成 以 后 设置 相应 的 标志 。 

jffs2 read inode range 函 数 首先 会 通过 JFFS2 相 应 的 数据 结构 找到 jffs2 full_ dnode 等 结构 ， 然 后 调用 jffs2 read_dnode 函 数 。jffs2 _ read dnode 函 数 首 


先 从 Flash 中 读 出 ffs2_raw_inode 结 构 ， 接 着 读 出 崇 随 在 jffs2_raw_inode 结 构 后 的 文件 数据 ， 并 且 将 读 出 的 数据 复制 到 内 核 缓存 中 。 人 至 此 ， 从 Flash 设 备 中 读 
数据 的 操作 完成 。 


6.2.5 ”垃圾 回收 机 制 


上 上 FS2 是 日 志 结构 文件 系统 ， 需 要 采用 垃圾 回收 机 制 对 Flash 设 备 上 那些 过 时 的 擦 除 块 进行 管理 。 当 上 下 FS2 的 超级 块 jffs2_sb_info 结 构 的 clean_list 链 表 中 的 
擦 除 块 的 数量 小 于 一 定 的 立 值 时 ， 垃 圾 回收 线程 束 会 被 唤醒 ， 开 始 对 Flash 设 备 上 被 标记 为 过 时 的 擦 除 块 进行 回收 。 


另外 ， 垃 圾 回收 机 制 还 将 考虑 损耗 均衡 问题 ， 不 会 只 对 jffs2_sb_info 结 构 的 dirty_list 链 表 上 的 过 时 擦 除 块 进行 回收 ， 还 会 以 一 定 比 例 选择 其 他 链表 上 的 擦 
除 块 ， 从 而 避免 dirty_list 链 表 上 的 擦 除 块 首先 被 磨损 坏 。 


JFFS2 坪 圾 回收 机 制 中 主要 功能 遂 数 的 调用 流程 如 图 6-6 所 示 。 


J]ffs2_start_garbage_collect_thread 


]ffs2_garbage_collect_ thread 


]Jifs2_garbage collect_pass 





图 6-6 JFFS2 垃 圾 回收 流程 图 


垃圾 回收 线程 是 在 JFFS2 挂 载 的 上 时候， 通过 jffs2 start garbage collect thread 函 数 创建 的 。jffs2 garbage collect thread 函 数 是 垃圾 回收 线程 具体 的 功 
能 函数 。 该 函数 首先 将 进入 休眠 状态 ， 然 后 等 竺 系统 的 信号 。 在 收 到 系统 相应 的 信号 后 ， 该 国 数 将 转 为 运行 状态 ， 并 根据 收 到 的 具体 信号 执行 相应 的 操作 。 如 
果 信 号 引发 的 操作 不 是 使 垃圾 回收 线程 退出 时 ， 则 jffs2 garbage collect_ pass 国 数 会 被 调用 ， 完 成 具体 的 垃圾 回收 操作 。 


jffs2 garbage_collect_pass 国 数 首先 从 下 FS2 超 级 块 的 gcblock 字 段 所 指向 的 链表 获得 一 个 待 回 收 的 擦 除 块 。 如 果 该 链表 为 空 ， 则 通过 
jffs2_find_gc_block 水 数 在 标记 为 过 时 的 擦 除 块 中 选择 一 块 。 在 选择 的 过 程 中 ， 需 要 注意 损耗 均衡 问题 。 然 后 该 溺 数 将 所 选择 的 擦 除 块 加 入 JFFS2 超 级 块 的 
erase_pending_list 链 表 中 。 最 后 ， 根 据 待 回收 的 擦 除 块 中 的 数据 实体 的 类 型 ， 调 用 相应 的 函数 完成 垃圾 回收 操作 。 这 个 过 程 将 一 直 循 环 ， 直 到 
erase_pending_list 链 表 中 的 擦 除 块 全 部 被 回收 ， 从 而 完成 垃圾 回收 任务 。 


6.3 YAFFS 


YAFFS 是 由 Charles Manning 于 2001 年 专门 根据 NAND Flash 特 性 设计 的 一 个 嵌入 式 文 件 系统 ， 并 于 2002 年 正式 发 布 。 


YAFFS1 是 YAFFS 文 件 系统 的 原始 版 本 ， 它 只 能 支持 512B 页 大 小 的 NAND Flash 存 储 设 备 ; YAFFS2 是 YAFFS1 的 升级 版 本 ， 可 以 支持 更 大 的 页 大 小 (如 
2KB、4KB) 的 存储 设备 。 随 着 固态 存储 技术 的 友 展 ，NAND Flash 容 量 也 越 来 越 大 ， 页 大 小 也 从 最 初 的 512B 增 长 到 2KB、4KB 甚 至 更 大 。 因 此 ， 目 前 YAFFS2 
应 用 更 为 广泛 。 


YAFFS 具 有 很 高 的 可 移植 性 ， 它 已 经 移植 到 Linux、WinCE、eCOS、pSOS、VxWorks 等 操作 系统 中 ， 并 使 用 在 各 种 电子 设备 中 。YAFFS 可 以 支持 多 种 类 


型 的 NAND Flash 芯 片 ， 目 前 YAFFS 可 以 支持 页 大 小 为 512B、1KB、2KB 页 大 小 的 NAND Flash 芯 片 。YAFFS 是 一 种 嵌入 式 文件 系统 ， 其 挂 载 速度 快 ， 占 用 内 
存 小 ， 常 用 作 智能 手机 等 电子 设备 的 嵌入 式 文 件 系统 。 


6.3.1 基本 概念 


YAFFS 是 一 种 专门 为 NAND Flash 设 计 的 宜 入 式 文件 系统 ， 在 正式 介绍 文件 系统 之 前 ， 首 先 介绍 一 些 基 本 概念 。 下 面 先 简单 介绍 一 下 闪存 的 物理 特 
性 ，YAFFS 中 块 (Block) 、 页 (Chunk) 的 组 织 结构 、 存 储 对 象 类 型 等 。 


1.NAND Flash 
由 于 YAFFS 是 针对 NAND Flash 介 质 的 蔡 入 式 文件 系统 ， 这 里 首先 简要 介绍 一 人 NAND FlashI 内 存 的 结构 特点 。 


不 同 于 传统 的 机 械 磁 盘 ，NAND Flash 由 块 (Block) 组 成 ， 块 由 页 (Page) 构成 ， 页 ， 包 含 数 据 区 (Data Area， 用 于 存储 用 户 数 据 ) 和 空 闪 区 
(OOB， 用 于 仓储 元 数据 和 差错 检查 ) 。 


NAND Flash 读 、 写 和 擦 除 的 基本 单位 不 同 ， 擦 除 时 以 块 为 单位 ， 读 写 时 以 页 为 单位 ， 造 成 不 能 原 位 更 新 。 由 于 NAND Flash 独 特 的 物理 特性 ，YAFFS 需 
要 提供 相应 的 存储 机 制 实现 对 闪存 数据 的 读 、 写 、 更 新 和 擦 除 等 操作 。 


2.Chunk 


NAND Flash 存 储 介 质 是 以 页 来 组 织 的 ， 页 是 分 配 和 编程 的 基本 单位 。 在 YAFFS 中 ， 读 、 写 操作 的 分 配 单位 是 chunk， 通 常 一 个 chunk 就 是 一 个 NAND 
Flash 闪 存 页 。 但 是 也 有 特殊 情况 ， 在 双 层 (或 多 层 ) 模式 下 ， 系 统 同 时 操作 两 个 (或 多 个 ) Flash 必 片 进 行 并 行 操作 ， 所 以 一 个 chunk 可 以 对 应 两 个 (或 多 
个 ) NAND Flash 闪 存 页 。 


YAFFS 是 一 种 日 志 式 文件 系统 ， 它 并 不 是 将 属于 同一 个 文件 的 所 有 数据 放 在 一 个 特定 的 位 置 ， 而 是 按照 页 分 配 的 顺序 存放 。 在 YAFFS 中 存在 两 种 类 型 的 


chunk: 
1) 数据 页 (Data Chunk) ， 即 普通 数据 页 ， 存 放 普 通 的 文件 数据 内 容 。 


2) 对 象 头 页 (Object header) ， 一 个 对 和 象 摘 述 符 ， 每 个 对 象 都 有 一 个 专 有 页 面 来 存储 该 对 象 对 应 的 信息 ， 称 为 对 象 头 页 。 对 和 象 头 页 中 保 仔 了 文件 的 模 
陈 、 所 有 者 标识 、 组 标识 、 长 度 、 文 件 名 、 父 目录 等 信息 。 


对 象 头 页 是 闪存 数 据 结 构 ， 存 在 于 Flash 上 。 闪 存 挂 载 持 ， 通 过 读 取 对 象 头 页 人 信息， 为 每 个 YAFFS 对 象 建立 内 存 结构 。Yaffs_ObjectHeader 所 存储 的 信息 
如 表 6-1 所 示 。 


表 6-1 对 象 头 页 内 容 


Name yaffs object 的 名 称 
ParentObjectID 记录 yaffs object 的 父 Object ID 
Type 说 明 此 yaffs _ object 是 File 、Directory、SoftLink 或 是 HardLink 
Protection (Only For Flle ) 表示 此 yaffs object 的 权限 

UID (File Only ) User ID 

GID (File Only) Group ID 

Time of Last Access (File Only) 最 后 存 取 时 间 

Time of Last Modification (File Only ) 最 后 修改 时 间 

File Size (File Only) 文件 大 小 

EquivalentObjectID (HardLink Only) 仅 用 于 HardLink 

Alias (SoftLink Only ) 仅 用 于 SoftLink 

CheckSum 和 校 验 ， 避 倪 不 一 致 


3. 空 用 区 


对 于 NAND Flash 上 的 每 一 个 闪存 页 ， 都 存在 一 定 的 空闲 空间 ， 比 如 512B+16B ( 即 512B 页 大 小 ，16B 空 闲 区 空间 ) 、2KB+64B 等 ， 这 些 空闲 区 域 可 以 用 
来 存储 附加 信息 ， 通 常 NAND 驱 动 只 使 用 了 这 些 空间 的 一 部 分 ，YAFFS 正 是 利用 了 这 部 分 空间 中 剩余 的 部 分 来 存储 文件 系统 相关 的 内 容 。 


YAFFs2 的 辅助 存储 区 一 般 是 64B (2K+64B/ 页 ) ， 其 空 册 区 (OOB 区 ) 一 般 会 存储 如 下 数据 ， 如 表 6-2 所 示 。 


表 6-2 空闲 区 结构 


blockState 块 状态 ， 非 0x 任 表示 坏 块 1B 





( 继 ) 
域 字 节 ( 1KB Page ) 字 节 ( 2KB Page ) 
chunkID 32 位 页 序列 号 
objectID 32 位 对 象 ID 
DBytes 
blockSequence 本 块 的 序列 号 (分 
tags 上 CC 
ECC 





YAFFS1 的 OOB 区 有 一 个 Deletion Marker 删 除 标 记 ，YAFFS1 使 用 部 分 页 编程 (Partial Page Programming) 技术 ， 在 删除 某 页 时 ， 更 改 该 页 的 OOB 区 
tag 中 的 Deletion Marker (数据 状态 字 节 ) ， 由 于 部 分 页 编程 会 导致 错误 ， 使 得 该 字 节 可 能 无 法 更 改 为 0， 因 此 在 YAFFS1 中 则 采用 了 一 种 方法 ， 即 更 改 后 的 
二 进 制 值 中 ， 位 为 1 的 个 数 各 小 于 6， 即 超过 两 位 为 0， 则 表示 该 Page 为 Invalid/deleted， 否 则 视 为 Valid Page。 


但 使 用 部 分 页 编程 会 使 得 NAND 型 闪存 的 硬件 设计 相对 较 困 难 ， 可 能 会 造成 数据 上 的 错误 ， 因 此 新 的 NAND 型 闪存 已 不 允许 再 使 用 部 分 页 编程 。 所 以 在 
YAFFS2 上 已 不 再 使 用 部 分 页 编程 。YAFFS1 亦 不 可 在 新 的 NAND 型 闪存 上 使 用 。 新 型 的 NAND Flash 为 了 提高 可 靠 性 ， 在 块 中 页 分 配 的 时 候 都 是 假设 顺序 写 ， 
因此 YAFFS2 不 使 用 Deletion Marker (数据 状态 字 节 ) ， 而 是 在 一 个 块 中 严格 地 顺序 写 。 


4. 对 象 

YAFFs 对 文件 系统 上 的 所 有 内 容 都 统一 当 作 Object (对 象 ) 来 处 理 ， 每 一 个 对 象 有 唯一 的 对 象 标识 符 (Object ID) 来 标示 。 这 些 对 象 包括 : 
` 普通 数据 文件 

$ 置 邓 

` 硬 链 接 (hard link) 

* 符号 链接 

. 特殊 对 象 (pipe、devices 等 ) 


下 面 重点 介绍 链接 的 概念 。 所 谓 链 接 ， 就 是 把 文件 名 和 计算 机 文件 系统 使 用 的 节点 号 inode 链 接 起 来 。 所 谓 硬 链接 ， 残 是 一 个 文件 的 一 个 或 多 个 文件 名 使 
用 hard link 设 置 链接 文件 时 ， 物 理 闪 存 人 存储 空间 与 inode 数 目 并 不 会 改变 ， 物 理 人 存储 空间 实际 上 只 有 一 份 文 件 的 拷贝 ， 所 有 硬 链接 也 都 只 有 一 个 inode 节 点 号 
关联 到 同一 个 文件 。 所 谓 软 链接 (soft link) ， 或 者 称 作 符号 链接 (Symbolic link) ， 它 实际 上 是 一 个 独立 的 文件 ， 其 文件 数据 块 中 存放 的 内 容 是 另 一 个 文件 
路 径 名 的 指向 ， 这 个 文件 会 让 数据 的 读 取 指向 它 链 接 的 那个 文件 的 文件 名 。 与 硬 链 接 不 同 ， 软 链接 有 着 自己 的 inode 节 点 号 以 及 用 户 数 据 块 ( 即 另 一 文件 路 径 
的 指向 ) 。 


需要 注意 的 是 ， 对 硬 链 接 和 软 链 接 的 删除 操作 大 有 不 同 。 对 于 硬 链 接 ， 如 果 将 任何 一 个 “文件 名 ” ( 即 相应 的 硬 链 接 ) 删除 ， 其 实际 文件 的 物理 存储 和 
inode 都 还 是 存在 的 ， 只 有 当 该 文件 的 所 有 硬 链接 全 部 被 删除 ， 才 会 在 物理 存储 空间 删除 该 文件 ， 相 应 的 inode 也 不 复 存 在 。 对 于 软 链接 ， 如 果 其 指向 的 源 文 
件 被 删除 ， 那 么 软 链接 的 文件 会 “ 打 不 开 ”， 系 统 将 提示 “无 法 打开 某 文件 ”， 实 际 上 就 是 找 不 到 其 指向 的 源 文件 。 


6.3.2 ”内 存 结构 
理论 上 , 日志 文件 系统 可 以 使 用 很 少 的 RAM 空 间 ,， 但 是 为 了 提高 性 能 ， 需 要 在 内 存 中 存储 一 些 数据 结构 。 对 于 大 多 数 文 件 系 统 而 言 ， 第 一 步 自 然 是 取得 


SuperBlock (类 似 于 FAT 中 的 DBR 和 EXT 中 的 超级 块 ) ， 但 是 YAFFS 本 身 在 NAND Flash 上 ， 并 不 存在 所 谓 的 SuperBlock， 其 完全 是 在 文件 系统 挂 载 的 过 程 中 
由 read_super 函 数 填充 的 。 


由 于 物理 上 没有 存储 SuperBlock， 所 以 NAND Flash 上 的 YAFFS 本 身 没有 存储 文件 系统 的 魔 数 (MagicNum ， 用 于 分 辨 是 何 种 文件 系统 ) ， 在 内 存 中 
SuperBlock 里 的 魔 数 也 是 直接 赋值 的 ， 所 以 存储 在 NAND Flash 上 的 任何 文件 系统 都 能 被 当 作 YAFFS 挂 载 上 来 ， 只 是 数据 都 会 被 当 作 错 误 数 据 放 在 
lost+found 目 录 中 。 


在 挂 载 过 程 中 ，YAFFS 还 需要 将 文件 系统 的 目录 结构 在 内 存 中 建立 起 来 。 由 于 没有 超级 块 ， 所 以 需要 扫描 YAFFS 分 区 ,根据 从 OOB 区 中 读 取 的 tags 信 息 ， 
判断 每 一 页 是 对 象 头 页 还 是 数据 页 。 再 根据 对 象 头 页 中 的 内 容 以 及 数据 页 中 的 ObjectID、ChunklD、serial Number 等 信息 ， 在 内 存 中 为 每 个 文件 建立 一 个 对 
应 的 yaffs_ object 对象。 


可 以 说 YAFFS 的 挂 载 过 程 束 是 YAFFS 建 立 内 存 数 据 结构 的 过 程 ， 因 此 下 面 重 点 讲解 YAFFS 内 存 中 重要 的 数据 结构 。 
1.yaffs dev 


yaffs dev 是 YAFFs2 最 核心 的 数据 结构 ， 相 当 于 YAFFs2 的 超级 块 ， 它 建立 了 整个 文件 系统 的 层次 结构 ， 并 衔接 VFS (Virtual File System， 为 各 类 文件 系 
统 提供 统一 的 应 用 编程 接口 ) 层 ， 如 图 6-7 所 示 。 
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图 6-7 文件 系统 层次 结构 


YAFFS2 层 






通常 一 个 具体 的 文件 系统 在 VFS 的 super_block 结 构 中 除了 通用 的 数据 外 ， 还 有 上 自己 专用 的 数据 。YAFFS 的 专用 数据 束 是 yaffs_dev 结 构 ， 主 要 用 来 存储 相 


天 软 硬 件 配置 信息 、 相 关子 数 指针 (底层 的 读 写 驱 动 沙 数据 针 ) 和 统计 信息 (系统 中 块 、 页 的 使 用 情况 ) 等 。 


在 yaffs_dev 结 构 体 中 ， 还 维护 着 以 下 各 种 数据 结构 与 统计 信息 。 
言 息 


万 /Go 


1) yaffs_block info 数 组 : 记录 着 NAND Flash 中 各 个 闪存 块 的 当前 状态 人 


2) 位 图 (bitmap) 数组 chunk_bits: 保存 系统 中 所 有 chunk 当 前 的 使 用 状态 。 每 个 块 占 用 位 图 数组 中 的 几 个 字 节 ， 每 个 chunk 只 对 应 字 节 中 的 一 个 位 。 
如 果 chunk 对 应 的 bit=0， 表 示 当 前 chunk 未 使 用 ， 为 空 闪 页 ; 如 果 chunk 对 应 的 bit=1， 表 示 当 前 chunk 已 使 用 ， 为 已 使 用 的 闪存 页 。 
2.yaffs object 


当 闪 存 挂 载 和 时， 会 为 每 个 YAFFS 对 象 找 寻 该 对 象 的 对 象 头 页 ， 从 而 在 内 存 中 建立 yaffs_ object 结 构 体 。 文 件 系统 中 的 每 个 对 象 (包括 普通 文件 、 目 录 、 链 
接 、 设 备 文件 等 ) ， 在 内 存 中 都 有 一 个 对 应 的 yaffs_object 结 构 体 。 通 过 创建 各 个 文件 对 象 的 yaffs_object，YAFFS 就 能 够 将 存储 在 NAND Flash 上 的 数据 系统 
地 组 织 起 来 ， 在 内 存 中 维护 一 个 完整 的 文件 系统 结构 。 


yaffs object 包 含 各 个 对 象 的 主要 元 数据 ， 从 而 不 必 读 取 物 理 NAND Flash 中 存储 的 对 象 头 页 来 快速 访问 对 象 ， 其 主要 保存 了 如 下 属性 信息 : 
:objectID: 唯一 标识 一 个 对 象 的 ID 号 。 
: 目录 指针 : 用 作 组 织 结构 ， 如 指向 父 目 录 的 Parent 指 针 ， 指 向 同 级 目录 中 其 他 对 象 链表 的 siblings 兄 弟 指针 。 
.type: 对 象 类 型 ， 如 目录 、 普 通 数 据 文 件 、 软 链接 、 硬 链接 等 。 
.petmissions: 修改 时 间 、 用 户 ID、 组 ID 等 文件 属性 。 
. 各 种 标记 位 : 用 作 YAFFS 的 维护 ， 如 脏 (dirty) 标记 、 删 除 标记 等 。 
` 根据 对 象 类 型 的 不 同 〈 目 录 、 文 件 、 链 接 ) ， 在 yaffs_object 中 还 有 其 各 自 专 有 的 数据 内 容 : 
` 普通 文件 : 文件 尺寸 ， 记 录 文 件 的 大 小 ; 一 个 yaffs_tnode 指 针 ， 用 于 快速 查找 文件 的 某 个 数据 页 在 NAND Flash 物 理 存储 空间 的 位 置 。 
` 目录 : 目录 项 内 容 双向 链表 头 。 
. 链接 : 软 链 接 (softlink) 的 alias 和 硬 链接 (hardlink) 指向 其 他 objectID。 
3.Tnode Tree 


每 一 个 yaffs object 都 有 一 个 yaffs tnode 指 针 ， 它 指向 该 文件 的 Tnode Tree 一 一 一 个 树 状 的 数据 结构 ， 通 过 Tnode Tree 可 以 在 一 个 文件 中 快速 搜索 到 所 
需要 的 数据 块 。Tnode Tree 是 动态 创建 和 释放 的 ， 它 占据 了 YAFFS 内 存 中 的 大 部 分 空间 。 对 于 每 个 文件 对 象 ，YAFFS 维 护 一 个 树 结构 ， 提 供 一 个 从 文件 中 寻 
找 数据 chunk 的 机 制 ，Tnode Tree 由 一 些 称 为 yaffs tnode 的 节点 组 成 。Tnode Tree 为 YAFFS 提 供 了 一 个 从 逻辑 地 址 到 物理 地 址 的 映射 机 制 ， 如 图 6-8 所 示 。 


RAM 和 仔 储 源 置 
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图 6-8 YAFFS 地 址 映射 图 
Tnode 节 点 树 建 立 了 文件 内 偏 移 到 物理 页 之 间 的 映射 ， 知 道 逻 辑 页 这 引号， 通过 检索 Tnode Tree， 可 以 知道 该 逻辑 页 的 物理 存储 位 置 。 


比如 说 读 文件 时 ， 使 用 者 会 给 出 待 读 页 在 文件 内 的 偏 移 量 offset，YAFFS 根 据 页 大 小 计算 出 该 偏 移 量 在 文件 的 第 几 个 chunk 中 ， 即 计算 出 逻辑 页 索引 号 ， 
然后 在 Tnode Tree 中 找到 相应 的 物理 页 位 置 。 


Tnode Tree 是 由 多 个 Thode 节 点 组 成 的 ， 依 照 所 处 层次 (Level) 的 不 同 而 分 成 两 部 分 ， 如 图 6-9 所 示 。 
1) 上 层 Tnode， 每 个 上 层 Tnode 由 8 个 入 口 项 组 成 。 


2) 底层 Tnode (第 0 层 Tnode) ， 每 个 底层 Tnode 由 16 个 指针 入 口 组 成 。 
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图 6-9 ”Tnode Tree 结 构图 


在 Tnode Tree 建 立 好 之 后 ， 当 系统 需要 读 取 该 文件 的 某 页 时 ， 如 chunk0x235， 则 需要 遍历 Tnode Tree 来 寻找 要 读 取 的 chunk 的 物理 位 置 ， 具 体 步 骤 如 
下 


1) 将 十 六 进 制 转化 为 二 进 制 ，0x235=0000001000110101。 


2) 将 二 进 制 切割 成 000.000.100.011.0101， 每 一 个 切割 区 代表 一 个 层次 的 Tnode 节 点 。 由 于 上 层 Tnode 节 上 点 只 有 8 个 入 口 项 ， 因 此 只 需要 3 个 二 进 制 位 ; 
底层 Tnode 节 点 有 16 个 入 口 项 ， 因 此 最 未 位 分 割 4 个 二 进 制 位 。 


3) 根据 所 切割 的 二 进 制 位 整理 如 表 6-3 所 示 。 


表 6-3 切割 二 进 制 位 


Tnode 层次 二 进 制 位 类 入 口 项 的 值 


第 3 层 或 更 遍 层 0 

第 2 层 (100),=(4),o 
第 1 层 (011)s=(3), 
第 0 层 (0101)=(5)is 





根据 表格 中 各 层 Tnode 的 入 口 值 在 Tnode Tree 中 寻找 ， 如 图 6-10 所 示 ， 最 终 在 第 0 层 Tnode 的 第 5 个 入 口 项 寻找 到 待 读 取 页 的 物理 存储 位 置 。 
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图 6-10 ”通过 Tnode Tree 寻找 物理 页 


4.yaffs obj bucket 

在 yaffs dev 中 有 一 个 yaffs obj bucket 结 构 体 ， 它 是 一 个 县 有 256 个 入 口 的 散 列 表 ， 如 图 6-11 所 示 。yaffs_obj bucket 散 列表 提供 了 一 个 通过 对 象 的 
object1ID 来 快速 查找 对 象 的 机 制 。 通 过 对 objectID 值 进行 散 列 来 选择 一 个 hash bucket， 每 一 个 hash bucket 都 有 一 个 双向 的 链表 ， 存 放 objectID 散 列 值 属于 
该 bucket 的 对 象 ，hash bucket 还 有 一 个 count 域 ， 存 放 属 于 该 bucket 的 对 象 数 目 。 





ObjectID 





~» hashlD=(OQbjectld%0236) 


图 6-11 yaffs_obj_bucket 结 构 


5. 目 录 结 构 


在 对 文件 进行 打开 、 重 命名 等 操作 时 ， 通 过 目录 结构 可 以 根据 对 象 名 来 找到 该 对 象 。 每 一 个 分 区 都 有 1 个 根 上 目录。 从 根 目 录 开 始 ， 将 同一 目录 下 的 各 个 对 
象 ， 用 兄 利 链表 (siblings) 联系 起 来 。 


YAFFS 的 目录 结构 通过 yaffs object type_ directory 组 成 对 象 树 形 结 构 ， 通 过 双 链 表 结 构 连 接 。 目 录 对 象 结构 还 有 一 个 儿子 链表 children (也 是 双 链 表 结 
构 ) ， 儿 子 链 表 用 于 存放 该 目录 下 的 子 对 象 。 每 一 个 yaffs_obj 都 含有 1 个 双 链 表 节 点 ， 称 作 sibling， 将 同一 个 目录 中 的 兄弟 对 象 连接 起 来 。 


除了 对 应 于 存储 在 NAND Flash 上 的 文件 对 象 而 建立 起 来 的 yaffs_ object 以 外 ， 在 read_super 执 行 过 程 中 还 会 建立 一 些 虚 拟 对 象 (Fake Object) ， 这 些 
Fake Object 在 NAND Flash 上 没有 对 应 的 物理 实体 ， 比 如 在 建立 文件 目录 结构 的 最 初 阶段 ，YAFFS 会 建立 四 个 虚拟 目录 (Fake Directory) : 


` tootDit: 根 目 录 。 

. unlinkedDir: unlinked 对 象 挂 接 的 目录 。 

:deleteDir: delete 对 象 挂 接 的 目录 。 

. lostNfoundDir: 无 效 数 据 块 挂 接 的 目录 。 
对 于 如 表 6-4 所 示 的 目录 结构 ， 其 对 应 的 目录 树 如 图 6-12 所 示 。 


表 6-4 目录 结构 表 


根 目录 


/a 目录 下 包含 c, de 
ib 空 目 录 
/lost+found 空 目 录 

/alc 目录 

/av/d 数据 文件 

/ale 数据 文件 
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图 6-12 ”目录 树 结 构图 


6.3.3 ” 扫 摘 挂 载 


1. 后 癌 扫 摘 过 程 


YAFFS 扫 描 挂 载 的 过 程 实际 上 就 是 YAFFS 建 立 文件 系统 内 存 结构 的 过 程 。 初 次 挂 载 文件 系统 时 ， 由 于 没有 历史 信息 ， 需 要 进行 全 盘 扫 描 。 即 扫描 NAND 
Flash 上 所 有 chunk 的 空 闪 区 ， 建 立 文 件 系 统 的 内 存 映射 ， 即 yaffs_dev 结 构 、 目 录 、yaffs_obj 等 内 存 结构 。 


YAFFs 扫 描 时 ， 根 据 读 取 的 chunk 的 空闲 区 中 chunklD 值 的 不 同 ， 会 有 下 列 不 同 的 处 理 方 法 。 


1) chunkID>0: 表示 该 chunk 是 数据 页 ， 并 根据 空 几 区 中 的 ObjectID 在 内 存 中 寻找 相应 的 yaffs_object 结 构 体 。 若 已 存在 ， 则 将 该 chunk 加 入 至 所 属 的 
yaffs_object 中 ; 若 不 存在 ， 则 根据 其 ObjectlD 建 立 一 个 对 应 的 yaffs_object 结 构 体 ， 并 将 该 chunk 加 入 至 对 应 的 对 象 结构 中 。 


2) chunkID=0: 表示 该 chunk 为 对 象 头 页 ， 并 根据 空 册 区 中 的 ObjectID 建 立 一 个 对 应 的 yaffs_object 对 象 结构 。 建 立 完成 后 ， 再 根据 对 象 头 页 中 的 父 目 


录 标 识 ParentObjectID 到 内 存 中 寻找 对 应 的 父 目 录 结 构 yaffs object， 并 将 原 yaffs_object 中 的 Parent 指 针 指 向 其 父 目 录 ， 即 将 对 和 象 挂 载 到 相应 的 父 目 录 。 


YAFFS2 使 用 后 向 扫描 ， 即 先 通过 block 的 分 配 顺序 block_Sequence 给 block 排 序 ， 先 扫描 最 后 分 配 的 block 的 最 未 页 chunk， 这 样 初次 匹配 的 ObjectlD: 
chunklD 一 定 是 当前 的 最 新 有 效 页 ， 以 后 扫描 到 具有 同样 ObjectID: chunklD 的 chunk 一 定 是 过 时 的 无 效 数据 。 


2. 内 存 块 状态 
在 YAFFS 初 始 化 扫 拉 u 所 有 闪存 块 时 ， 会 在 内 存 中 记录 各 个 块 的 状态 ， 并 存储 在 yaffs_BlockState 结 构 中 。YAFFS 和 存在 以 下 块 状态 ， 如 表 6-5 所 示 。 


表 6-5 YAFFS 块 状态 


状 态 名 解 笠 
UNKNOWN 该 块 状态 未 知 (在 文件 系统 挂 载 之 前 ) 
NEEDS SCANNING 撰 扫 摘 时 发 现 该 块 中 存在 存储 数据 ， 需 要 进行 扫描 
SCANNING 该 块 目前 正在 被 扫描 
EMPTY 该 块 不 存在 存储 数据 ， 被 探 际 过 的 块 就 是 本 状态 
ALLOCATING 当前 块 正在 被 分 配 以 用 来 存储 数据 
FULL 该 块 中 的 所 有 页 均 已 被 分 配 ， 且 至 少 有 一 页 的 数据 是 有 效 的 
DIRTY 块 中 所 有 页 均 已 被 分 配 ， 且 所 有 页 数据 均 已 删 际 。 该 块 可 以 擦 除 后 返回 空 状 态 
CHECKPOINT 该 块 中 存放 有 checkpoint 数据 
COLLECTING 该 块 正在 被 垃圾 回收 
DEAD 该 块 被 标记 为 坏 块 ， 不 能 存储 数据 


各 闪存 块 的 状态 不 是 固定 不 变 的 ， 在 YAFFS 挂 载 和 使 用 的 过 程 中 ， 闪 存 块 的 状态 会 不 断 地 友 生 变化 ， 块 状态 转换 如 图 6-13 所 示 ， 实 线 表 示 正 常 的 块 状态 转 
换 ， 虚 线 表 示 闪 存 块 友 生 错 误 时 的 状态 转换 ， 即 将 该 内 存 块 标记 为 坏 块 。 





一 一 一 正常 状态 转换 
------ 发 生 错误 时 的 状态 转换 
和 A 
一 一 一 少数 情况 下 进行 的 状态 转换 
图 6-13 YAFFS 块 状态 转换 图 
3.Checkpoint 与 Summary 机 制 
为 加 快 YAFFS 的 扫描 速度 和 挂 载 效 率 ，YAFFS2 及 用 了 Checkpoint 和 Summary 机 制 。 
(1) Checkpoint 机 制 


Checkpoint 机 制 保证 文件 系统 初次 挂 载 之 后 ， 在 下 次 挂 载 时 不 用 进行 全 盘 扫 摘 即 可 建立 文件 系统 的 内 存 结构 ; 由 于 YAFFS1 在 安 妆 时 要 扫 摘 整个 NAND 
Flash 的 空 亲 区 得 到 设备 上 所 有 文件 的 信息 ， 这 可 能 使 它 的 挂 载 安 委 时 间 比 其 他 使 用 超级 块 的 文件 系统 慢 。 


针对 此 问题 ，YAFFS2 提 供 一 种 机 制 解 决 这 个 问题 ， 即 在 印 载 YAFFS2 或 执行 yaffs_sync fs 同步 操作 (Linux2.6 内 核 下 才 用 ) 时 ， 将 内 存 中 的 一 些 数据 结构 
组 织 成 相应 的 checkpoint 形 式 写 入 NAND Flash 物 理 存储 空间 。 


这 样 ， 下 次 挂 载 安 六 时 只 要 读 出 这 些 内 容 所 在 的 内 存 物理 区 ， 而 不 需 读 取 所 有 的 内 存 块 便 可 以 在 内 存 中 完整 地 建立 文件 系统 的 数据 结构 ， 从 而 完成 扫描 挂 
载 。 


(2) Summary 机 制 


summary 数 据 使 系统 在 扫 摘 时 ， 无 须 扫 摘 NAND Flash 中 的 所 有 chunk， 极 大 地 提高 了 挂 载 效率 。YAFFS1 扫 摘 时 要 求 读 取 每 一 个 chunk 的 空 凋 区， 但 这 
是 一 个 非常 费时 的 过 程 。 因 此 ， 在 YAFFS2 中 添加 了 Summary 数 据 。 


Block Summary 束 是 将 该 block 中 的 所 有 chunk 的 空 闪 区 数据 全 部 集中 写 到 该 block 的 最 后 几 个 (通常 就 是 最 后 一 个 ) chunk 中 。 这 样 束 不 用 读 取 所 有 


chunk 的 空 册 区 ， 只 需 读 取 最 后 一 个 chunk 融 能 获取 该 block 的 所 有 chunk 的 空 汀 区 数据 ， 从 而 可 以 显著 提高 系统 的 挂 载 速度 。 当 然 ， 如 果 block 的 Summary 
数据 不 可 用 ， 系 统 会 及 用 之 前 的 扫描 机 制 进行 挂 载 。 


6.3.4 ”垃圾 回收 


YAFFS 是 一 种 日 志 式 的 文件 系统 ， 当 对 文件 中 的 数据 进行 更 新 时 ，YAFFS 并 未 真正 地 删除 原来 的 数据 ， 而 是 在 新 的 空 闪 页 中 写 入 更 新 的 数据 ， 并 将 原始 页 
标记 为 无 效 数据 。 随 着 数据 的 不 断 更 新 ， 文 件 系 统 的 物理 存储 区 会 存在 许多 无 效 数 据 ， 因 此 需要 相应 的 垃圾 回收 机 制 ， 对 NAND Flash 物 理 存 储 区 中 的 无 效 数 
据 进 行 垃圾 回收 。 


YAFFS 坪 圾 回收 按照 如 下 方式 进行 : 
1) 首先 运用 一 个 启发 式 搜索 算法 寻找 一 个 值得 进行 垃圾 回收 的 闪存 块 〈 即 闪存 块 中 的 有 效 数 据 页 足够 少 ) ， 如 果 没 有 找到 就 退出 。 


2) 遍历 选中 进行 垃圾 回收 的 内 存 块 中 的 所 有 页 ， 如 果 是 有 效 页 束 复 制 到 一 个 新 的 空 内 页 再 删除 ， 当 该 闪存 块 中 的 所 有 页 全 部 为 无 效 页 之 后 就 擦 除 该 内 存 
块 ， 释 放 物 理 存储 空间 。 


YAFFS 的 垃圾 回收 策略 分 为 两 种 ， 即 主动 垃圾 回收 和 被 动 垃 圾 回收 。 
1. 被 动 垃圾 回收 


系统 中 存在 足够 多 的 空闲 闪存 块 可 用 ， 此 时 YAFFS 就 采用 被 动 垃圾 回收 (passive garbage collection) 策略 ， 即 只 有 当 闪 存 块 中 的 有 效 页 (valid 
chunk) 足够 少时 才 启 动 垃圾 回收 。 


如 何 判 定 一 个 闪存 块 中 的 有 效 页 数目 足够 少 呢 ? 这 是 通过 一 个 阐 值 threshold 进 行 判定 的 ，threshold 初 始 值 为 4， 每 次 寻找 失败 就 增 大 阐 值 ， 但 在 被 动 垃 
圾 回收 策略 下 ， 该 赋值 不 能 超过 闪存 块 中 chunk 数 目的 一 半 。 


2. 主 动 垃圾 回收 


如 果 系 统 中 只 存在 很 少 的 空 闪 块 ， 则 NAND Flash 的 物理 存储 空间 不 够 充足 ， 此 时 YAFFS 就 会 采用 主动 垃圾 回收 (aggressive garbage collection) 策 
略 ， 即 只 要 闪存 块 中 存在 无 效 页 (invalid chunk) ， 残 会 对 该 内 存 块 进行 坪 圾 回收 。 


YAFFS 坪 圾 回收 的 具体 流程 如 图 6-14 所 示 。 


根据 此 块 被 使 用 页 数 和 删除 页 数 找 出 最 “ 脏 ” 块 


调用 GarbageCollectBlock0O 进 行 回 收 处 理 
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读 第 i=0 页 的 tags 所 有 页 全 未 使 用 ， 下 接 探 除 
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J 此 页 被 删除 
将 此 有 效 数据 页 写 入 一 个 空 页 | | 不 进行 处 理 


国 i<nChunksPerBlock? 
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探 除 此 块 ， 回 收 完成 


图 6-14 垃圾 回收 流程 


6.3.5 ”使 用 均衡 


NAND Flash 闪 存 颗 粒 是 有 使 用 寿命 的 ，Flash 存 储 器 件 只 能 承受 一 定 次 数 的 写 操 作 和 擦 除 操作 (也 就 是 Flash 的 耐 受 力 ) 。Flash 文 件 系 统 必须 保证 不 能 让 
写 操 作 和 擦 除 操作 一 直 在 少数 几 个 块 上 进行 ， 这 样 会 导致 这 些 块 使 用 过 度 而 其 他 的 块 却 几乎 很 少 使 用 。 


对 于 像 FAT 这 样 的 文件 系统 来 说 ， 使 用 均衡 就 显得 尤为 重要 。 但 是 对 于 YAFFS， 负 载 均 衡 并 不 需要 过 多 关心 ， 因 为 YAFFS 是 一 种 日 志 式 文件 系统 ， 每 次 写 
操作 都 是 在 日 志 的 尾部 进行 ， 并 不 会 持续 对 同一 个 块 重 写 。 


两 种 实现 使 用 均衡 的 方法 如 下 : 
1) 使 用 一 组 特定 的 溯 数 来 实现 使 用 均衡 。 
2) 由 某 些 操作 或 机 制 的 影响 (系统 内 部 机 制 ) 保证 一 定 程度 的 使 用 均衡 。 


YAFFs 采 用 第 二 种 方法 。 首 先 作 为 一 个 日 志 式 文 件 系统 ，YAFFs 的 固有 特性 残 是 按照 顺序 书写 每 一 个 块 ; 其 次 ， 块 都 是 从 分 区 内 的 空 亲 内 存 块 中 顺序 分 配 
的 ， 所 以 块 的 分 配 操作 也 不 会 影响 使 用 均衡 。 因 此 虽然 YAFFs 中 并 没有 特定 的 代码 实现 使 用 均衡 ， 但 也 能 保证 一 定 程 度 的 使 用 均衡 。 


6.4 UBIFS 


UBIFS (Unsorted Block Image File System， 无 序 区 块 映 像 文 件 系 统 ) 是 Linux 上 正在 研发 的 新 一 代 闪 存 文 件 系统 ， 目 前 由 Nokia 公 司 和 匈牙利 赛 格 德 
大 学 共同 开发 。UBIFS 的 出 现 主 要 是 解决 文件 系统 存在 的 挂 载 时 间 长 、 内 存 消 耗 大 、 可 扩展 性 差 、 损 耗 均 衡 处 理 能 力 差 等 问题 。JFFS2 的 挂 载 时 间 是 与 Flash 大 
小 呈 线 性 比 的 ，UBIFS 殉 服 了 这 一 弱点 (UBI 子 模块 挂 载 时 间 还 是 与 Flash 大 小 呈 线 性 比 的) 。 总 的 来 说 ，UBIFS9 具 有 如 下 特点 : 


1) 可 扩展 性 强 。UBIFS 对 NAND Flash 的 容量 有 着 很 好 的 扩展 性 。 也 就 是 阅 ， 系 统 挂 载 的 时 间 、 内 存 消耗 以 及 /O 速 度 都 不 依赖 于 NAND Flash 的 容量 
(对 于 内 存 消耗 并 不 是 完全 准确 的 ， 但 是 依赖 性 非常 低 ) 。 


2) 挂 载 速度 快 。 不 同 于 jfFS2，UBIFS 在 挂 载 阶段 不 需要 扫 摘 整个 文件 系统 ，UBIFs 挂 载 介质 的 时 间 只 是 富 秒 级 ， 挂 载 的 时 间 也 不 依赖 于 NAND Flash 的 
容量 ; 然而 UBI 的 初始 化 时 间 是 依赖 于 NAND Flash 容 量 的 。 


3) 回 写 。 文 件 的 改变 并 不 是 立刻 提交 到 NAND Flash 和 存储 介质 上 ,而 是 缓存 这 些 修 改 直 到 达到 写 入 的 条 件 ， 这 样 做 减少 了 I/O 的 数目 ， 因 此 改善 |/O 性 能 
和 系统 性 能 。 回 写 也 是 文件 系统 的 标准 技术 ， 由 于 数据 没有 立刻 写 入 Flash， 回 写 功 能 带 来 了 数据 丢失 的 风险 。 


4) 异常 恢复 。 即 使 不 干净 (unclean) 重启 或 者 掉 电 ， 文 件 系 统 都 可 以 恢复 。UBIFS 可 以 从 index 破 坏 后 恢复 ，UBIFS 中 的 每 一 片 信息 都 由 一 个 header 来 
摘 述 ， 因 此 可 以 通过 扫 摘 这 个 NAND Flash 介 质 来 重 构 文件 系统 。 想 象 一 下 ， 如 果 你 擦 除了 FAT 文 件 系统 的 FAT， 那 么 对 于 FAT 文 件 系 统 是 致命 的 错误 ,但 是 擦 
除 UBIFs 的 index 后 ， 仍 然 可 以 重 构 文件 系统 ， 当 然 这 需要 一 个 特定 的 用 户 空间 程序 来 完成 这 个 恢复 过 程 。 


5) 快速 MO 技术 。 即 使 鞭 用 回 写 ，UBIFS 的 性 能 也 接近 JfFs2。 


6) 灵活 的 压缩 技术 。UBIFS 可 以 对 单个 文件 打开 、 关 闭 压 缩 功 能 。 


7) 完整 性 。UBIFs 通 过 写 checksum 到 NAND Flash 介 质 上 来 保证 数据 的 完整 性 ，UBIF s 不 会 无 视 损 坏 文件 数据 或 元 数据 。 在 默认 情况 下 ，UBIFS 仅 仪 检 
查 元 数据 (metadata) 的 CRC， 但 是 可 以 通过 挂 载 选项 强制 进行 数据 元 余 校 验 的 检查 。 


6.4.1 UBI 


UBIFS 位 于 UBI 设 备 之 上 ， 而 UBI 设 备 又 依赖 于 MTD。UBIFS 的 突出 特点 是 减少 了 挂 载 时 间 。 这 里 首先 介绍 UBI 与 UBIFS 的 关系 ，UBI 工 作 在 MTD 之 上 与 文 
件 系 统 之 下 ， 它 是 一 种 块 管理 工具 ;而 UBIFS 则 是 一 种 文件 系统 类 型 ，UBI 层 次 结构 如 图 6-15 所 示 。 


UBl 是 MTD 层 的 高 级 表示 并 构建 在 MTD 分 区 之 上 ， 具 备 损耗 均衡 与 坏 块 管理 功能 ， 所 以 UBIFS 不 像 其 他 文件 系统 需要 实现 损耗 均衡 与 坏 块 管理 ， 这 种 方法 
使 得 扩展 UBIFS 变 得 非常 方便 。 


UBIFS 


Linux 内 核 


NAND Flash 











图 6-15 ”UBI 层 次 图 
1.UBI 特 性 


UBI 提 供 了 基于 MTD 分 区 之 上 的 卷 分 区 与 坏 块 管理 、 损 耗 均衡 机 制 。UBI 将 物理 擦 除 块 (PEB) 映射 为 逻辑 擦 除 块 (LEB) ，UBI 逻 辑 卷 由 一 组 连续 的 LEB 
组 成 ， 每 个 LEB 可 以 映射 到 任何 一 个 PEB，UBI 管 理 着 这 个 映射 关系 并 同时 对 NAND Flash 坏 块 进行 管理 ; 当 某 一 个 PEB 成 为 坏 块 后 ， 与 其 对 应 的 LEB 就 会 被 重 
新 映射 并 将 数据 移动 到 好 的 PEB 上 。 UBI 根 据 卷 的 类 型 可 分 为 静态 卷 与 动态 卷 。 静 态 UB| 卷 的 内 容 为 只 读 并 且 受 保护 ， 而 动态 UBI 卷 可 读 可 写 ， 数 据 安 全 性 由 文 
件 系统 层 保证 。 对 于 那些 因为 位 翻转 而 造成 ECC 校 验 无 法 纠 错 的 NAND Flash 物 理 块 ，UBI 会 将 这 些 块 里 的 数据 移 到 其 他 物理 擦 除 块 。 与 MTD 分 区 类 似 ，UBI 
也 分 成 几 个 卷 来 管理 ， 它 们 的 共同 点 为 : 


1) MTD 分 区 为 物理 擦 除 块 ，UBI 为 逻辑 擦 除 块 。 

2) 都 支持 擦 除 、 读 写 等 基本 操作 。 

而 UBI 分 区 相对 于 MTD 分 区 有 更 多 的 优势 : 

1) UBI 实 现 了 Flash 的 损耗 均衡 与 坏 块 管理 ， 使 上 层 文 件 系统 实现 更 方便 简单 。 

2) UBI 卷 可 动态 创建 ， 删 除 与 改变 卷 大 小 。 

2.UBI 关 键 数据 结构 分 析 

UBI 在 每 个 PEB 的 起 始 位 置 存储 了 两 个 大 小 都 为 64 字 节 的 头 ， 分 别 为 EC header 与 VID header。 
1) EC header 描 述 块 已 被 擦 除 的 次 数 ， 其 在 内 核 中 描述 的 数据 结构 如 表 6-6 所 示 。 


表 6-6 EC headet 数 据 结构 


结构 体 : ubi ec _hdr 


_be32 magic 头 纠 数 

_U8 version UBI 版 本 号 

_u8 padding 预 留 功能 

_be64 ec 探 除 次 数 

_be32 vid hdr offset 逻辑 卷 ID 头 的 位 置 
_be32 image seq UBI 镜像 序号 

ug8 padding2 预 留 功能 

_be32 hdr crc 头 校 验 


2) VID header 摘 述 该 物理 块 所 属 哪个 逻辑 卷 ， 其 在 内 核 中 摘 述 的 数据 结构 如 表 6-7 所 示 。 


表 6-7 VID headet 数 据 结 构 


结构 体 : ubi vid_ hdr 


be32 masgic 头 幻 数 

_U8 version UBI 版 本 号 

ug vol type 所 属 卷 类 型 ， 静态 或 动态 
u8 copy flage 描述 是 否 是 男 一 个 物理 块 的 拷贝 
_u8 compat 卷 属性 

_be32 vol id 逻辑 郑 id 

_be32 lnum 逻辑 块 数量 

ug8 padding 预 留 

_be32 data size 块 中 包含 数据 的 字 节 数 
_be32 used ebs 卷 中 已 用 逻辑 块 的 数量 
_be32 data pad 块 中 没有 使 用 的 字 市 数 
be32 data crc 存放 逻辑 块 的 校 验 码 
u8 padding2 预 留 

_be64 sqnum 逻辑 块 序号 

_u8 padding3 预 留 

_be32 hdr crc 头 校 验 


对 于 不 支持 子 页 的 NAND Flash 来 说 ，EC header 存 放 企 每 个 物理 探 除 块 的 第 一 页 的 起 始 64 字 节 ，VID header 和 存放 在 每 个 物理 擦 除 块 的 第 二 页 的 起 始 64 
字 节 。 读 写 的 最 小 单元 是 页 ， 所 以 LEB 大 小 为 块 大 小 减 去 开始 的 两 页 大 小 。 


UBI 管 理 着 以 下 三 张 表 : 


1) volume table ( 卷 表 ) : 这 个 表 记 录 了 卷 大 小 、 卷 名 字 、 卷 类 型 以 及 卷 校 验 等 。 为 了 防止 突然 断 电 的 情况 ， 在 Flash 上 保存 着 两 份 UBI 卷 表 ， 其 对 用 户 
空间 不 可 见 。 


2) erase block association table (映射 表 ) : 记录 着 LEB 到 PEB 的 映射 关系 ， 这 个 表 只 存在 于 内 存 中 ， 并 没有 记录 在 Flash 上 ， 在 UBI 初 始 化 的 时 候 建 成 
这 张 表 。 


3) EC table ( 擦 除 计数 表 ) : 是 记录 PEB 上 擦 除 计数 的 表 ， 这 个 表 主 要 是 在 损耗 均衡 机 制 中 使 用 。 它 只 存在 内 存 中 ， 在 UBI 系 统 初 始 化 的 时 候 通 过 扫描 
UBI 卷 对 应 的 PEB 的 EC header 结 构 体 建成 的 。 


3.UBI 损 耗 均衡 机 制 分 析 


由 前 述 可 知 ，UBI 管 理 着 LEB 与 PEB 的 映射 。 当 UBI 擦 除 一 个 PEB 时 ， 它 会 在 这 个 物理 块 上 写 入 一 个 已 增加 擦 除 计数 的 EC header。 而 UBI 的 去 映射 操作 首先 


将 原先 的 LEB 与 PEB 去 除 映射 关系 ， 然 后 擦 除 PEB， 最 后 将 EC header 写 入 PEB 中 。 图 6-16 描 述 了 UBI 卷 的 映射 操作 方法 。 





图 6-16 ”UBI 卷 的 映射 操作 方法 
操作 1) 对 UBI 分 区 卷 1 的 LEBO 进 行 去 映射 操作 ， 调 度 PEB3 对 其 进行 擦 除 ， 并 将 擦 除 计数 加 1 后 的 EC header 写 入 PEB3 中 。 
操作 2) 对 UBI 分 区 卷 1 的 LEB0 进 行 映 射 操作 ， 了 映射 到 PEB1 后 ， 并 将 VID header 写 入 PEB1 中 。 


由 上 分 析 可 知 EC header 用 于 衡量 某 个 PEB 的 擦 写 次 数 ， 用 于 损耗 均衡 的 目的 ; 而 VID header 用 于 表示 PEB 属 于 哪个 UBI 分 区 卷 。 当 一 个 PEB 没 有 被 LEB 映 
射 时 ， 它 只 有 EC header， 没 有 VID header。UBI 静 态 卷 与 UBI 动 态 卷 选择 PEB 的 类 型 不 同 。 静 态 卷 因为 数据 只 读 ， 不 更 新 数据 ， 所 以 其 LEB 会 映射 一 些 擦 除 次 
数 高 的 PEB， 让 出 擦 除 次 数 低 的 PEB 给 动态 卷 使 用 ， 其 流程 如 图 6-17 所 示 。 


操作 1) 对 静态 卷 0 的 LEB2 进 行 去 映射 操作 ， 调 度 PEB0 对 其 进行 擦 除 ， 并 将 擦 除 计数 加 1 后 的 EC header 写 入 PEB0 中 。 
操作 2) 寻找 擦 除 次 数 高 的 物理 块 PEB3， 并 将 LEB2 映 射 到 PEB3 上 ， 使 静态 卷 的 所 有 LEB 映 射 到 擦 除 次 数 高 的 PEB 上 。 


由 于 UBI 每 次 做 擦 除 操作 时 都 会 进行 图 6-16 所 示 的 去 映射 操作 ， 一 旦 去 映射 后 LEB 会 寻找 擦 除 次 数 最 小 的 PEB 重 新 映射 ， 避 免 了 对 同一 个 PEB 的 操作 次 数 过 
导致 过 硫 损耗 。 另 外 UBI 的 坏 块 管理 预 留 了 一 个 未 映射 的 PEB 池 ， 当 友 现 菜 个 块 是 坏 块 后 ，UBI 会 利用 预 留 的 块 蔡 代 这 个 坏 块 ， 并 将 数据 转移 到 新 的 PEB 上 。 


静态 卷 0 动态 卷 ] 





虚线 为 氛 除 次 数 高 的 物理 二 


图 6-17 UBI 层 损耗 均衡 的 举例 


6.4.2 ”UBIFS 分 析 


从 前 面 介 绍 可 知 UBIFS 工 作 在 UBI 郑 之 上 ， 无 须 关 心 MTD 层 与 Flash 层 的 操作 。UBIFS 具 有 挂 载 时 间 少 、 突 发 掉 电 的 数据 保护 、 快 速 的 |/O 读 写 能 力 ， 在 GB 
级 上 的 Flash 表 现 得 更 加 突出 。 本 节 将 分 析 UBIFS 一 些 机 制 的 实现 细节 。 


1.UBIFS 特 性 


因为 Flash 的 “ 先 探 后 写 ” 特 性 ， 其 无 法 直接 在 原先 的 物理 块 上 更 新 数据 ， 如 果 采 用 移 探 除 再 回 写 更 新 数据 的 方法 ， 所 用 的 时 间 比 直接 写 数据 多 100 倍 ， 所 
以 文件 系统 需要 实现 非 原 位 更 新 (out of place) 机 制 ， 而 非 原 位 更 新 后 还 需要 回收 那些 存在 无 效 数据 的 物理 块 。 


UBIFS 将 文件 的 元 数据 (metadata) 和 数据 (data) 保存 在 一 起 ， 整 个 metadata 与 data 的 复合 体 称 为 node， 每 一 个 node 记 录 了 哪个 文件 拥有 这 个 
node， 以 及 什么 数据 (比如 data 所 在 文件 的 offset、data 长 度 等 ) 保存 在 这 个 node 中 ，UBIFS 就 是 基于 node 结 构 设 计 的 。 


2.UBIFS 的 非 原 位 更 新 机 制 


当 在 其 他 块 上 写 更 新 的 数据 时 ， 原 先 的 块 就 包含 了 有 效 数 据 和 无 效 数据 ， 如 果 不 对 这 些 块 进行 回收 ， 久 而 久之 文件 系统 将 用 完 擦 除 块 。 所 以 需要 实现 垃圾 
回收 机 制 将 原先 块 的 有 效 数据 移动 到 其 他 块 ， 然 后 擦 除 它 以 供 其 他 数据 写 入 。 图 6-18 举 例 简要 说 明了 UBIFS 的 非 原 位 更 新 与 垃圾 回收 流程 。 


1) 首先 将 需要 更 新 的 数据 Data1' 写 入 一 个 空 的 LEB 中 。 
2) 为 了 以 后 能 够 回收 Data 所 在 的 块 ， 将 有 效 数据 Data2 移 动 到 其 他 LEB 上 。 
3) 擦 除 Data 所 在 块 ， 因 为 Data 数 据 已 经 过 时 ， 需 要 回收 这 个 块 。 


为 了 能 够 及 时 回收 不 再 使 用 的 块 ， 文 件 系统 需要 可 以 快速 地 判断 存储 块 中 的 数据 是 否 有 效 ， 因 此 引入 了 节点 结构 。UBIFS 定 义 了 索引 节点 node (ubifs- 
ino-node 结 构 体 ) 、 目 录 项 node (ubifs-dent-node 结 构 体 ) 与 数据 node (ubifs-data-node 结 构 体 ) ， 每 个 node 结 构 体 中 定义 
_u8key[UBIFS_MAX_KEY_LEN] 成 员 ， 这 个 key 唯 一 地 标识 了 目录 、 文 件 、 数 据 之 间 的 联系 ; 索引 节点 node 的 key 使 用 inode 的 索引 号 表示 ， 而 目录 项 node 的 
key 由 “ 父 inode 索 引号 + 目录 项 名 字 ” 来 表示 。 它 使 垃圾 回收 者 能 够 直接 识别 数据 所 在 的 擦 除 块 ， 决 定 哪些 数据 要 移动 、 哪 些 要 丢弃。 不 像 JFFS2 将 node 和 存储 
在 RAM 上 ， 当 文件 系统 挂 载 时 需要 扫描 整个 Flash 来 建立 索引 节点 ， 这 将 导致 挂 载 时 间 随 着 Flash 尺 寸 的 增 大 而 变 长 ; UBIFS 是 将 索引 节点 存储 在 Flash 上 来 缩 
豆 挂 载 时 间 。UBIFS 的 node 使 用 了 B+ 树 的 数据 结构 存储 在 RAM 与 Flash 上 。 但 是 将 node 存 入 Flash 有 以 下 两 个 问题 : 


1) 当 Flash 上 的 节点 node 进 行 非 原 位 更 新 时 需要 对 node 进 行 垃圾 回收 。 


2) 每 次 数据 友 生 改变 时 ， 索 引 节 氮 都 要 更 新 。 


te 2 
15 写 数 Datal' | me 


二 二 





pa 


图 6-18 UBIFS 非 原 位 更 新 与 垃圾 回收 流程 
UBIFS 针 对 上 述 两 个 问题 采用 了 游离 树 (wondering tree) 与 日 志 (journal) 测量 ， 如 图 6-19 所 示 。 
1) RAM 与 Flash 空 间 存储 着 一 样 的 Node 节 点 。 
2) 将 数据 写 入 Flash 中 后 ，RAM 上 立即 更 新 Node 为 Node _ New， 但 是 Flash 空 间 的 Node 节 点 并 不 马上 更 新 ， 而 是 利用 LOG 日 志 区 保存 了 一 份 New; 
3) 在 提交 的 时 候 根据 LOG 与 RAM 的 节点 将 存储 在 Flash 的 节点 更 新 为 最 新 的 节点 Node_New。 


使 用 LOG 日 志 策 略 的 好 处 是 防止 Flash 节 点 还 没 更 新 时 系统 掉 电 。 假 如 系统 处 于 图 6-19 的 第 二 行 时 突然 掉 电 或 者 崩溃 ， 此 时 RAM 存 储 区 的 索引 节点 已 丢 
失 ，UBIFS 会 使 用 replay 操 作 根 据 Flash 索 引 节 点 与 LOG 日 志 重 建 RAM 索 引 节 点 ， 最 后 恢复 到 正常 状态 。 


UBIFS 通 过 commit 操 作 来 更 新 Flash 的 索引 节点 。 


ie Flash 存 储 区 


7 | LOG 日 志 


Node _ New 是 Node 的 更 新 节点 DT 
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图 6-19 ”节点 更 新 流程 
3.UBIFS 的 分 区 


根据 图 6-15 可 知 UBIFS 工 作 在 UBI 分 区 卷 上 ， 每 个 分 区 卷 都 是 从 LEB0 开 始 的 ，UBIFS 将 UBI 分 区 卷 分 为 六 个 区 ， 如 图 6-20 所 示 。 


LEBO LEB1-LEB2 


Super 、 


图 6-20 ”UBIFS 分 区 结构 


1) Super Block 分 区 存在 于 LEB0， 在 内 核 中 使 用 struct ubifs_sb_node 结 构 体 ,保存 着 文件 系统 基本 不 变 的 参数 ， 比 如 一 些 Flash 的 物理 块 大 小 、 页 大 小 


等 。 只 有 当 调 整 UBI 分 区 卷 大 小 时 ，ubifs sb_node 才 会 被 重 写 。 


2) Master 分 区 存在 于 LEB1 与 LEB2 中 ， 在 内 核 中 使 用 struct ubifs mst node 结构 体 ， 保 存 着 每 个 索引 节点 的 根 节点 。 


3) Journal 分 区 从 LEB3 开 始 ， 是 node 节 后 的 改动 信息 保存 区 域 。 该 区 域 的 尺寸 可 以 通过 mkfs.ubifs 参 数 确定 ， 在 提交 的 时 候 束 根据 LOG 更 新 Flash 物 理 存 


储 的 索引 节点 。 


4) LEB Properties 分 区 也 残 是 LEB 属 性 区 ， 保 存 每 个 LEB 块 的 使 用 情况 ， 也 是 当 提 和 交 的 友 生 时 才 会 更 新 。 


5) orphan 分 区 意 为 珀 儿 分 区 ， 使 用 固定 数量 的 LEB， 用 struct ubifs_orph_node 结 构 体 表示 。 该 分 区 记录 着 已 经 删除 的 文件 索引 号 ， 其 作用 是 当 擦 除 操 


作 到 一 半 时 印 载 文件 系统 ， 可 企 下 次 挂 载 文件 系统 时 将 孤儿 索引 找到 并 删除 ，UBIFs 在 扳 儿 区 域 中 存储 了 一 张 表 以 保存 折 儿 索引 。 


块 。 


6) Main 主 分 区 保存 着 文件 系统 的 数据 域 索 3 引 。 
4.UBIFS 的 注册 与 注销 


与 大 多 数 文 件 系统 类 似 ，UBIFSs 使 用 内 核 提 供 的 register filesystem () 进行 接口 注册 ， 挂 载 文 件 系 统 使 用 ubifs get sb () 方法 填充 虚拟 文件 系统 超级 
使 用 unregister filesystem () 进行 接口 注销 ， 将 UBIFS 移 出 filesystem_type 链 表 。 


6.5 exFAT 


exFAT (Extended File Allocation Table， 扩 展 FAT， 也 称 作 FAT64， 即 扩展 文件 分 配 表 ) 文件 系统 是 一 个 折 中 的 方案 ， 是 微软 公司 在 Windows 
Embeded5.0 以 上 (包括 Windows CE5.0、6.0，Windows Mobile5、6、6.1) 中 引入 的 一 种 适合 于 闪存 的 文件 系统 ， 专 为 内 存 设备 设计 ， 为 了 解决 FAT32 等 
不 支持 4GB 及 其 更 大 的 文件 而 推出 ， 高 容量 的 SDXC 卡 默认 都 是 这 种 格式 ， 但 也 并 不 强求 。 对 于 闪存 ，NTFS 不 适合 使 用 (及 用 “日 志 式 ”， 较 频繁 的 读 写 操作 
会 减少 内 存 的 寿命 ) ，exFAT 更 为 适用 。Windows XP SP2、Windows Vista SP1 及 以 上 系统 都 支持 exFAT 格 式 ， 分 区 最 大 容量 为 64ZB， 文 件 体 积 最 大 为 
16EB， 簇 尺寸 可 以 大 到 16MB,， 访问 控制 则 还 是 依靠 ACL (访问 控制 列表 ) 。exFAT 利 用 剩余 空间 位 图 来 管理 容量 分 配 ， 提 高 删除 性 能 ， 这 对 改善 写 入 性 能 非 
常 重要 ， 尤 其 是 对 比 于 NTFS。 


但 要 注意 的 是 ， 在 exFAT 分 区 上 安装 Windows 系 统 是 不 可 能 的 。Windows Vista/7 都 非常 依赖 NTFS 的 文件 许可 等 特性 。 由 于 微软 授权 机 制 的 限 
制 ，exFAT 的 普及 并 不 广泛 ， 在 消费 电子 领域 的 应 用 也 不 是 特别 多 。 总 之 ，exFAT 是 一 个 较为 适合 闪存 的 文件 系统 格式 ， 在 随身 U 盘 、SD 卡 等 介质 上 有 较为 广 
泛 的 应 用 。 


与 FAT16、FAT32 等 文件 系统 相 比 ，exFAT 文 件 的 特点 有 : 
. FAT16 最 大 支持 4GB 的 分 区 ，FAT32 最 大 支持 32GB 的 分 区 ， 而 exFAT 理 论 上 最 大 支持 64ZB 的 分 区 ， 系 统 建议 的 最 大 分 区 是 512TB。 
FAT16、FAT32 对 文件 的 最 大 支持 的 秘 是 64KB，exFAT 理 论 上 最 大 支持 64ZB 的 文件 ， 系 统 建 议 的 最 大 文件 是 512TB。 


FAT16、FAT32 对 文件 支持 的 最 大 饼 是 64KB，exFAT 最 大 支持 32MB 的 艇 大 小 ， 可 选 的 艇 大 小 范围 是 512B~32MB， 范 围 非常 大 ， 更 大 的 簇 大 小 对 处 理 大 
数据 更 加 高 效 。 


由 于 微软 官方 没有 公开 exFAT 的 格式 规范 ， 所 以 本 书 一 方面 通过 在 互联 网 上 参考 国内 外 开发 人 员 的 研究 成 果 ， 另 一 方面 利用 一 些 磁盘 分 析 的 工具 ， 对 制作 
的 exFAT 格 式 磁盘 进行 磁盘 原始 数据 的 分 析 。 采 用 的 方法 为 ， 通 过 格式 化 、 增 加 /删除 目录 、 文 件 等 操作 ， 对 比 原始 数据 的 改变 ， 找 出 改变 的 规律 ， 忆 结存 储 
有 关 的 数据 结构 。 在 本 书 的 研究 中 ， 使 用 Win Hex 来 查看 原始 的 磁盘 数据 。 


6.5.1 exFAT 分 区 布局 


一 个 exFAT 格 式 的 磁盘 分 区 总 体 来 讲 被 分 成 了 三 个 部 分 ， 如 图 6-21 所 示 ， 即 保留 区 、FAT 区 和 | 数据 区 。 





图 6-21 exFAT 文 件 系统 分 区 整体 布局 


保留 区 包含 了 两 部 分 的 内 容 : 引导 扇 区 (VBR) 和 引导 扇 区 的 备份 ， 里 面 存储 着 文件 系统 的 基本 信息 ， 包 括 文件 系统 的 标识 、 大 小 、 基 本 存储 单元 描述 


物 


FAT 区 实质 是 一 个 FAT， 该 表 用 以 描述 数据 区 中 存储 单元 的 分 配 状态 ， 以 及 为 文件 或 目录 内 容 分 配 的 存储 单元 的 前 后 连接 关系 。 


数据 区 就 是 用 来 存储 目录 、 文 件 内 容 的 区 域 ， 也 称 为 cluster heap， 意 指 一 堆 cluster 的 集合 。cluster ( 艇 ) 是 文件 系统 中 使 用 的 一 个 基本 概念 ， 表 示 了 分 
配 存 储 空 间 的 基本 单元 。 


exFAT 文 件 系 统 和 FAT32 文 件 系统 有 许多 类 似 之 处 ， 阅 读本 节 时 可 以 结合 2.1 节 中 的 相关 内 容 。 下 面 按照 exFAT 文 件 系 统 分 区 整体 布局 中 各 分 区 的 先后 顺 
序 ， 介 绍 exFAT 文 件 系统 的 组 织 结构 。 


1.VBR 


VBR (Volume Boot Record) 也 称 为 DBR (DOS Boot Record) ， 即 DOS 的 引导 记录 ,已 成 为 操作 系统 的 引导 扇 区 。 在 一 个 装 有 操作 系统 的 硬盘 上 ， 计 
算 机 启动 时 首先 由 BIOS 读 取 主 引导 记录 MBR 的 内 容 ， 以 确定 各 个 逻辑 驱动 器 及 其 起 始 位 置 ， 然 后 读 取 活动 分 区 的 DBR， 将 控制 权 交 给 DBR， 由 DBR 来 引导 操 
作 系 统 。 


主 VBR 所 在 的 区 域 实际 包含 了 12 个 sector，5 个 部 分 : The Main Boot Sector (MBS) 、The Main Extended Boot Sector、The OEM Parameters、A 
Reserved Sector 和 The Checksum Sector。 和 备份 VBR 同 样 也 是 12 个 sector， 对 主 VBR 进 行 备 份 。 


主 VBR 的 第 一 个 sector 共 512 字 节 ， 数 据 分 成 6 个 部 分 : 跳 转 指令 、OEM 人 代号、 保留 区 、BPB、 引 导 代 码 和 结束 标志 ， 如 图 6-22 所 示 。 


跳 转 指令 : 本 身 占 用 两 字 节 ， 将 程序 执行 流程 跳 转 到 引导 程序 处 ， 比 如 “EB76” 就 是 汇编 语言 的 “JMP76”。 需 要 注意 该 指令 本 身 占用 两 字 节 ， 计 算 跳 
转 目标 时 以 该 指令 的 下 一 字 节 为 基准 ， 所 以 执行 的 下 一 条 指令 应 该 位 于 78H， 紧 接 跳 转 指令 的 是 一 条 空 指令 NOP (90H) 。 


OEM 代 号 : 占 8 字 节 ， 由 创建 文件 系统 的 OEM 厂商 规定 ， 微 软 将 其 设置 为 “EXFAT”.。 
保留 区 : 0B8H~3FH 这 部 分 是 原来 FAT 使 用 的 BPB 占 用 的 区 域 ，exFAT 这 部 分 填 零 ， 不 使 用 。 


BPB: BIOS Parameter Block，BIOS 参 数 块 ， 表 6-8 中 列 出 了 BPB 区 域 的 详细 字段 说 明 。 其 中 的 隐藏 分 区 是 指 本 分 区 之 前 使 用 的 扇 区 数 ， 该 值 与 分 区 表 中 
摘 述 的 该 分 区 起 始 扇 区 号 一 致 ， 对 于 主 分 区 来 说 ， 是 MBR 到 该 分 区 DBR 之 间 的 扇 区 数 。 


Ofiset 0 1 2 34 S36 7 89ABCLCDE KE OEM 代 号 
et Ee EB 76 90 45 58 46 41 54 20 20 20 46 41 34 站 45 58 46 41 54 20 20 20] 99 6999-09-99 
000000010 0 00 00 00 00 0 00 00 00 00 


跳 转 指令 000000020 0 0 0 00 00 00 00 00 的 i 00 800000 |] 
000000030 ”00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
000000040 00 00 00 00 00 | 保留 区 
000000050 CO 13 13 13 
000000060 69 AB AE 64 RPR 
000000070 00 00 00 
000000080 B4 7D 8B 
000000090 07 CD 10 
0000000A0 
0000000B0 
0000000C0 
0000000D0 
0000000E0 
0000000F0 
000000100 
000000110 
000000120 
000000130 
000000140 
000000150 
000000160 
000000170 
000000180 
000000190 
0000001A0 
0000001B0 
0000001C0 FF FF FF 
0000001D0 FF FF FF | ”结束 标志 
0000001E0 FF FF _ FF 
0000001F0 


引导 代码 





图 6-22 ”exFAT 的 主 引 导 扇 区 
表 6-8 exFAT BPB 数 据 


0x40 
0x48 
UX350 
UX354 
0X358 
OxSC 
0x60 
Ox64 
0x68 
0x6A 
Ox6C 
0x6D 
Ox6E 
Ox6F 
0x70 


一 | 一 | 一 IRI 上 B21 人 |1 人 全 | 全 | 上 1 上 情 
木 
六 


字段 名 和 定义 
隐藏 书 区 数 
分 区 总 扇 区 数 
FAT 起 始 忆 区 数 
FAT 出 区 数 
第 一 个 cluster 的 起 始 悄 区 


总 的 cluster 数量 


根 目录 的 首 族 号 
卷 厅 列 号 


版 本 号 ， 当 前 版 本 号 (01.00 ) 
volume 状态 

FAT 个 数 

驱动 硕 选 择 

分 配 空间 的 百分比 


扩展 的 主 引导 扇 区 包含 了 MBS 之 后 的 8 个 sector， 提 供用 来 存储 更 多 的 引导 代码 ， 每 个 sector 的 最 后 两 字 忆 是 “55AA”。 


2.FAT 


文件 分 配 表 (File Allocation Table，FAT) 用 来 记录 文件 所 在 位 置 的 表格 ， 它 对 于 硬盘 的 使 用 是 非常 重要 的 ,假若 丢 失 文 件 分 配 表 ， 那 么 硬盘 上 的 数据 
就 无 法 定位 而 不 能 使 用 了 。 文 件 系统 按 艇 对 磁盘 的 空间 进行 分 配 管理 ， 实 际 操作 的 时 候 磁 盘 上 的 艇 被 编号 。 在 FAT 中 ， 每 4 字 节 的 一 个 表 项 就 对 应 一 个 艇 ， 通 
过 该 表 项 的 值 可 以 查找 对 应 艇 的 状态 ， 如 是 否 可 用 等 。FAT 有 如 下 特点 : 


. exFAT 通 常 只 


一 个 FAT (FAT32 是 两 个 ， 为 主 、 备 用 关系 ) ， 在 格式 化 的 时 候 创建 。 


. FAT 跟 在 VBR 之 后 ， 在 BPB 中 有 专门 的 栏 位 来 描述 。 


* FAT 由 FAT 表 项 (FAT entry) 组 成 ， 每 个 FAT entty 有 4 字 节 ， 即 32 位 。 


` 每 个 FAT 表 项 都 对 应 了 一 个 固定 的 编号 ， 从 0 开始 ， 即 第 一 个 FAT 表 项 是 0 号 FAT 项 ， 第 二 个 FAT 表 项 是 1 号 FAT 项 ， 以 此 类 推 。 


. 前 两 个 FAT 表 项 有 专门 的 用 途 ，0 号 用 来 存放 所 有 的 介质 类 型 ， 比 如 硬盘 的 介质 类 型 是 “F8”; 1 号 一 般 都 是 4 字 节 的 “FF”。 


: 数据 区 中 的 每 个 cluster 都 映射 到 FAT 中 的 唯一 一 个 FAT 项 ， 因 为 0 号 和 1 号 被 特殊 占用 ， 所 以 数据 区 的 第 一 个 cluster 就 是 2 号 比 ， 第 二 个 cluster 就 是 3 号 铸 ， 


以 此 类 推 。 


: 数据 中 的 文件 都 是 以 答 为 单位 存放 ， 每 一 个 文件 占用 多 个 千 的 时 候 ， 这 些 千 


登记 在 FAT 中 ， 也 可 能 不 是 ; 当 徐 号 是 连续 的 时 候 ， 不 会 在 FAT 中 登记 。 


综 上 所 述 ，exFAT 中 的 FAT 的 功 


人 Lb 有 目 
月 EXE 


在 引导 局 区 的 BPB 中 ， 有 参数 记录 了 FAT 的 起 始 扇 区 号 和 总共 的 扇 区 数 。 


ol 
A 
人 
凌 
E 
< 


能 不 是 ; 当 久 号 不 连续 的 时 候 ， 答 号 就 以 簇 链 的 方式 


记录 不 连续 存储 的 文件 的 复 链 ， 所 以 在 FAT 中 看 到 某 项 的 值 为 0， 并 不 能 说 明 该 cluster 没 有 被 使 用 。 如 图 6-23 所 示 ， 


EFB 苓 数 信 息 
40 隔 三 局 区 数 


48 时 届 区 数 4096S5637T 
50 FhT 起 她 扁 区 号 046 
cd FhT 扁 区 涩 





图 6-23 exFAT FAT 信 息 


在 格式 化 时 ， 会 将 FAT 的 第 一 个 扇 区 清 零 (后面 的 扇 区 不 会 清 零 ) ， 写 入 0 号 和 1 号 FAT 项 ， 另 外 还 会 写 入 复位 图 文件 、 大 写字 符 文 件 和 根 目 录 所 占 篮 对 应 
的 FAT 项 。 如 图 6-24 所 示 是 FAT 的 第 一 个 扇 区 的 原始 数据 。 


0 号 FAT 项 〈 扇 区 的 头 4 字 节 ， 每 项 固定 为 4 字 节 ， 以 此 类 推 ) 固定 为 “F8FF FF FF”; 1 号 FAT 项 固定 为 “FF FF FF FF”; 艇 位 图 文件 占用 了 2、3、4 号 共 


3 个 cluster; 大 写字 符 文件 是 5 号 cluster; 根 目 录 是 6 号 cluster。 





簇 位 图 文件 
Cffset F 
D000100000 
000100010 
D000100020 


U000100030 00 O00 DUO O00 00/00 bb O00 bu bo UN Du bu O00 DO 00 


大 写字 符 文件 根 目 录 
图 6-24 exFAT FAT 表 数据 结构 
3. 数 据 区 和 根 目录 


数据 区 位 于 FAT 之 后 ， 其 开始 位 置 企 BPB 人 参数 里 面 有 摘 述 ， 如 图 6-25 所 示 ， 首 复 的 起 始 扇 区 号 即 表示 数据 区 的 起 始 扇 区 号 。 从 数据 区 开始 ， 融 是 以 cluster 
为 单位 进行 文件 的 存储 ， 包 括 系统 文件 和 用 户 文 件 ， 此 处 的 文件 泛 指 目录 和 文件 。 实 际 上 系统 文件 很 少 ， 只 有 几 个 ， 存 储 的 位 置 在 数据 区 开始 的 几 个 cluster 
中 ， 分 别 是 复位 图 文件 (bitmap) 、 大 写字 符 文件 (upcase) 和 根 目录 。 系 统 文件 对 于 用 己 来 说 不 可 见 ， 用 作文 件 系统 内 部 使 用 ， 根 目录 除外 ( 根 目 录 也 是 
系统 目 身 创建 ， 用 户 不 能 修改 ， 但 是 用 户 可 见 ) 。 


首 秋 的 起 妈 属 区 王 
分 区 的 吕 芒 妆 


图 6-25 ”exFAT 数 据 区 信息 








对 用 尸 来 说 ， 根 目录 是 最 重要 的 一 个 文件 。 我 们 使 用 具体 的 文件 系统 时 ， 首 先 看 到 它 的 根 目录 。 其 位 于 整个 文件 系统 目录 树 的 最 顶层 ,其 下 是 子 目 录 和 文 
件 ， 根 目录 是 该 文件 系统 上 面 文 件 操作 的 入 口号 ， 对 文件 、 目 录 进 行 任何 操作 前 需要 查找 到 其 位 置 ， 查 找 的 过 程 都 是 从 根 目录 开始 。 根 目录 是 一 个 特殊 的 文 
件 ， 它 没有 目录 项 ， 内 容 区 域 用 来 存放 包含 的 子 目录 和 文件 的 目录 项 结构 。 根 目录 所 在 的 遍 区 在 文件 系统 格式 化 的 时 候 被 国定 下 来 ， 计 算 方式 是 : 


root sector offset= 首 化 起 始 局 区 二 ( 根 目 录 首 化 号 -2) XX 每 徐 局 区 个 数 


在 根 目录 下 包含 三 个 系统 文件 : 卷 标 、 复 位 图 以 及 大 写字 符 文 件 ， 当 然 这 里 人 存放 的 都 是 目录 项 ， 这 些 系统 文件 的 数据 部 分 都 放 在 各 目的 数据 区 域 。 


6.5.2 ”目录 项 

目录 项 是 有 着 32 字 节 固 定 长 度 的 数据 ， 该 数据 被 设计 用 来 标识 文件 或 者 目录 本 身 (而 非 其 中 的 数据 ) ,包括 文 件 名 、 大 小 、 起 始 艇 号 、 创 建 时 间 等 属性 信 
息 。 目 录 项 的 作用 和 特点 如 下 : 

. 目录 项 就 是 一 个 文件 的 索引 ， 通 过 索引 可 以 查找 文件 的 名 字 、 属 性 和 内 容 存 放 的 地 址 。 

. 根 目录 下 的 文件 和 目录 存放 在 根 目录 区 中 ， 其 子 目录 下 面 的 文件 和 文件 夹 放 在 子 目 录 对 应 的 存储 区 中 。 

. 目录 项 的 第 一 字 节 用 来 描述 目录 项 的 类 型 ， 剩 下 的 31 字 节 用 来 记录 文件 的 相关 信息 。 


目录 项 类 型 包括 : 系统 文件 目录 项 和 用 户 文件 目录 项 。 其 中 ， 系 统 文 件 目录 项 代表 了 exFAT 格 式 化 时 创建 的 系统 文件 ， 用 户 文件 目录 项 则 是 接触 最 多 的 用 
户 文 件 。 


1. 系 统 文 件 目录 项 
系统 文件 包括 卷 标 、 复 位 图 和 大 写字 符 ， 它 们 的 目录 项 分 布依 次 位 于 根 目录 的 开头 ， 都 是 在 格式 化 的 时 候 创建 的 。 


卷 标 目录 项 本 身 只 占用 32 字 节 的 目录 项 数据 ， 而 不 会 占用 到 另外 的 cluster 空 间 。 如 表 6-9 所 示 摘 述 了 卷 标 目录 项 各 个 字段 的 说 明 。 以 一 个 实际 的 卷 标 目录 
项 来 说 ，“03H” 表 示 没 有 卷 标 ;在 设置 卷 标的 情况 下 ， 首 字 节 是 “83H”。 卷 标的 理论 长 度 是 11 字 节 ， 实 际 可 达 15 字 节 ， 使 用 Unicode 码 ;目录 项 中 不 记录 
起 始 篮 号 和 大 小 ， 不 记录 时 间 戳 。 


表 6-9 着 标 目录 项 各 字段 含义 


偏 移 长 度 含 义 
0x00 目录 项 类 型 (特征 值 为 “83H”) 


人 | 


禾 位 图 文件 不 允许 用 户 访问 和 修改 。 其 特点 为 : 复位 图 文件 的 起 始 复 号 一 般 都 为 2， 复 位 图 目录 项 中 不 记录 时 间 戳 。 


表 6-10 描 述 的 是 艇 位 图 目录 项 各 个 字段 的 含义 。 艇 位 图 文件 简单 记录 了 数据 区 所 有 的 cluster 的 使 用 情况 ( 即 这 个 cluster 是 否 被 使 用 ) 。 作 为 exFAT 的 一 个 
系统 文件 ， 类 似 于 NTFS 里 面 的 $BitMap， 文 件 中 的 每 个 位 映射 到 数据 区 中 的 一 个 cluster， 如 果 该 cluster 被 分 配 ， 则 在 艇 位 图 文件 的 相应 位 标记 “1”， 如 果 
这 个 cluster 没 有 被 使 用 ， 则 对 应 的 位 残 是 “0”。 图 6-26 给 出 了 2 号 艇 (cluster) 的 原始 数据 。 以 这 段 数据 为 例 来 分 析 当 前 文件 系统 中 cluster 的 使 用 情况 。 这 
个 数据 的 第 一 字 节 “1F”， 转 换 成 二 进 制 “00011111”， 从 低位 开始 计算 ,并且 exFAT 的 0、1 号 这 两 个 禾 被 保留 ， 从 2 号 艇 开始 ， 也 束 是 第 1 位 对 应 的 是 2 号 
复 。 这 里 低 5 位 全 是 1， 融 表示 2、3、4、5、6 号 这 5 个 cluster 被 使 用 。 对 应 实际 的 磁盘 情况 ， 刚 好 是 被 复位 图 文件 、 大 写字 符 文 件 和 根 目录 所 占用 。 


表 6-10 ”和 绪 位 图 目录 项 各 字段 含义 
偏 移 长 度 i 
0x00 目录 项 类 型 (特征 值 为 “81H”) 
偏 移 (位 ) 长 度 (位 ) 含义 


有 两 个 FAT 则 
Ux01 、 、 
为 1， 人 否则 为 0 
1 |” 保留 
0x02 
0X14 





Ox18 8 | 筷 位 图 文件 的 大 小 


Difset 0 1 2 3 4 5 07 8 9 A B C DE F 
O000400000 1F 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
000400010 0000 00 00 00 00 00 00 00 00 00 00 00 00 00 00 


图 6-26 2 号 炙 (cluster) 的 原始 数据 


大 写字 符 文件 目录 项 是 在 分 区 格式 化 的 时 候 被 创建 ， 它 不 允许 用 尸 访 问 和 修改 。 其 特点 为 : 大 写字 符 文件 的 目录 项 一 般 都 跟 在 艇 位 图 文件 的 目录 项 之 后 ; 
目录 项 中 不 记录 时 间 故 。 表 6-11 给 出 了 大 写字 符 文件 目录 项 中 各 个 字段 的 含义 。 大 写字 符 文件 类 似 于 NTFS 里 面 的 元 文件 $bUpCase， 在 exFAT 中 的 位 置 是 紧 接 
艇 位 图 文件 。 该 文件 用 来 存储 全 部 的 Unicode 字 符 ， 每 个 字符 占用 2 字 节 ， 用 于 比较 、 排 序 、 计 算 散 列 值 等 ， 大 写字 符 文 件 的 大 小 固定 是 5836 字 节 。 


表 6-11 大 写字 符 目 录 项 各 字段 含义 


偏 移 长 度 含 义 


0x00 目录 项 类 型 (特征 值 为 “82H”) 
0x04 TableChecksum 
0x18 8 | 大 写字 符 文件 的 大 小 


2. 用 户 文 件 目录 项 


系统 文件 通常 不 被 用 户 察 沈 ， 用 户 接 触 得 最 多 的 还 是 用 户 文 件 。 用 户 在 使 用 一 个 文件 系统 时 ， 在 该 文件 系统 上 能 够 看 到 的 文件 、 目 录 都 被 称 为 用 己 文 件 。 
用 户 文件 包括 目录 项 和 文件 数据 两 个 部 分 。 每 个 用 户 文件 至 少 有 三 个 目录 项 ， 被 称 为 三 个 属性 ， 其 目录 项 首 字 节 的 值 (特征 值 ) 分 别 是 85H、COH 和 C1H。 


属性 1 目录 项 记录 了 对 文件 最 基本 的 摘 述 ， 包 括 文件 类 型 、 属 性 、 创 建 时 间 等 。 表 6-12 给 出 了 属性 1 的 各 个 字段 的 摘 述 。 


表 6-12 用 户 文件 属性 1 目录 项 各 字段 含义 


中 


偏 移 长 度 含 义 
0x00 目录 项 类 型 (特征 值 为 “85H”) 
0x01 附属 目录 项 数目 
0x02 checksum 
0x04 2 文件 属性 

区 

0x06 保留 
0x08 文件 创建 时 间 
0x0C 最 后 修改 时 间 
0x10 最 后 访问 时 间 
Ox14 创建 时 间 精 确 到 10ms 
Ox15 最 后 修改 时 间 精 确 到 10ms 
0x16 CreateUtcOffset 
0x17 最 后 修改 UtcOffset 
Ox18 最 后 AccessedUtcOffset 
于 到 


属性 2 目录 项 对 文件 名 、 文 件 大 小 和 文件 内 容 的 起 始 位 置 进行 了 描述 。 表 6-13 列 出 了 属性 2 的 目录 项 中 各 个 字段 的 描述 。 其 中 GeneralFlags 是 文件 碎片 标 


， 表 示 文 件 的 内 容 数 据 是 否 处 在 连续 的 cluster 上 面 。 


表 6-13 用 户 文件 属性 2 目录 项 各 字段 含义 





偏 移 长 度 含义 
0x00 目录 项 类 型 (特征 值 为 “COH ”) 
0x01 1 (连续 为 03H， 


偏 。 移 长 度 含义 
0x03 文件 名 字符 数 (Unicode 码 ， 每 个 字符 两 字 节 ) 
0x04 文件 名 Hash 值 (文件 名 改变 ，Hash 值 也 改变 : 文件 移动 ， 该 值 不 变 ) 
0x06 保留 2 
0x08 | 区 作 大 小 1 
0x10 保留 3 
0x14 起 始 戏 号 
0x18 8 | 文件 大 小 2 (为 NTFS 的 压缩 属性 准备 ， 一 般 与 “文件 大 小 1” 一致) 


属性 3 目录 项 用 来 保存 文件 名 ， 采 用 Unicode 编 码 ， 文 件 名 的 每 个 字符 占用 两 个 字 节 的 Unicode 编 码 。 表 6-14 列 出 了 属性 3 各 个 字段 的 摘 述 。 


表 6-14 用 户 文件 属性 3 目录 项 各 字段 含义 


偏 。 移 长 度 含义 
保 旬 
0x02 文件 名 (Unicode 码 ， 一 个 字符 两 字 节 ) 
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第 / 草 ”容错 与 与 平衡 

通过 前 面 章节 的 介绍 我 们 知道 ，NAND Flash 存 储 器 具有 存储 密度 高 、 改 写 速 度 快 等 优点 ， 适 用 于 存储 大 量 数 据 ， 因 而 在 业界 得 到 了 越 来 越 广泛 的 应 用 。 
但 是 NAND Flash 也 有 一 些 固有 的 缺点 直接 导致 了 基于 NAND Flash 搭 建 的 存储 系统 在 可 靠 性 方面 的 不 足 。 

作为 大 规模 存储 器 件 时 ，NAND Flash 的 主要 问题 如 下 : 

1) NAND Flash 忌 片 中 会 出 现 随机 位 翻转 的 现象 ， 在 对 数据 进行 读 写 操作 过 程 中 都 有 可 能 在 某 些 位 上 发 生 位 翻转 ， 使 最 终 读 出 的 数据 出 现 随机 位 错误 。 


2) NAND Flash 心 片 在 刚 出 三 的 时 候 束 会 存在 一 些 坏 块 ( 称 作 初 始 坏 块 ) ， 并 且 随 着 心 片 的 使 用 还 会 出 现 新 的 坏 块 ( 称 作 使 用 坏 块 ) 。 坏 块 中 的 数据 不 
能 正确 编程 ， 当 进行 读 取 操 作 时 融会 读 出 大 量 错误 的 数据 ， 从 而 严重 影响 数据 的 存储 和 读 写 等 操作 的 可 靠 性 。 


3) NAND Flash 中 块 的 探 除 次 数 有 限 ， 如 果 超 过 可 探 除 的 最 大 值 将 导致 坏 块 的 出 现 ; 同时 在 使 用 过 程 中 ， 块 与 块 乙 间 探 除 次 数 的 不 均衡 会 导致 整个 
NAND Flash 的 寿命 降低 并 影响 其 读 写 性 能 。 


对 于 高 速 大 容量 存储 系统 而 言 ， 如 何在 现 有 基础 上 提高 存储 系统 的 可 靠 性 一 直 都 是 一 个 研究 热点 。 本 章 将 针对 上 述 三 个 问题 逐一 详细 介绍 当前 的 主要 解决 
方 


狂 


针对 NAND Flash 位 翻转 问题 : 需要 通过 采用 有 效 的 纠 错 技 术 ， 对 读 写 数 据 进行 校 验 和 纠 错 来 降低 数据 的 误 码 率 以 提高 可 靠 性 。NAND Flash 的 纠 错 可 以 


通过 各 种 纠 错 码 来 实现 ， 如 汉 明 码 、CRC 码 、RS 码 和 BCH 码 等 。 在 将 数据 写 入 NAND Flash 之 前 进行 编码 操作 ， 并 将 校 验 码 连同 原始 数据 一 起 写 入 NAND 
Flash 的 空 帮 区 ; 在 读 取 操 作 时 ， 再 执行 译 码 操作 ， 根 据 读 出 的 校 验 码 纠正 出 错 的 位 ， 从 而 实现 对 随机 位 错误 的 纠 错 。 

针对 NAND Flash 坏 块 问 题 : 由 于 坏 块 的 稳定 性 无 法 保证 ， 因 此 不 能 保证 写 入 的 数据 是 对 的 ， 或 者 即使 写 入 对 了 也 无 法 保证 读 出 来 的 数据 是 对 的 。 考 虑 到 
要 保证 存储 数据 的 完整 性 和 正确 性 ， 需 要 采取 坏 块 管理 技术 来 实现 对 原 有 坏 块 和 新 产生 坏 块 的 有 效 管理 ， 准 确 识别 出 坏 块 并 且 在 进行 读 、 写 、 擦 除 操作 时 将 坏 
块 屏 散 挥 。 

针对 NAND Flash 探 写 寿 全 有限 的 问题 : 为 提高 内 存心 片 的 整体 寿命 ， 需 要 采用 损耗 均衡 技术 ， 通 过 特定 的 算法 实现 对 存储 块 的 使 用 均衡 操作 。 通 过 引入 
损耗 均衡 策略 ， 分 配 已 探 除 次 数 较 少 的 块 来 进行 数据 更 新 ， 将 损耗 平均 地 分 散 到 整个 NAND Flash 的 存储 空间 ， 延 长 NAND Flash 的 使 用 寿命 。 


下 面 分 别 对 固态 存储 系统 中 常用 的 错误 校 验 码 、 平 衡 机 制 和 坏 块 管 理 方案 进行 介绍 。 


7.1 销 吴 校 验 码 


7.1.1 概述 


先进 的 工艺 友 展 在 使 得 NAND Flash 存 储 容量 增 大 的 同时 ， 也 使 得 各 个 仓储 单元 之 间 的 间隔 越 来 越 小 。 各 个 人 存储 单元 之 间 的 距离 越 近 ， 其 相互 之 间 的 影响 
越 大 ， 隧 道 效应 变 得 更 显著 ,漏电 流 增 大 ， 从 而 使 得 数据 的 存储 稳定 性 变 差 。 存 储 单元 在 使 用 时 可 能 出 现 的 个 别 位 翻转 ， 以 及 空间 环境 的 辐射 导致 的 单 粒 子 翻 
转 都 会 导致 数据 出 现 误 码 。 由 于 随机 位 翻转 而 导致 的 错误 可 以 分 为 以 下 三 种 : 


1) 写 错误 。 在 编程 操作 时 ， 不 合适 的 电压 将 造成 隧道 注入 的 电子 量 不 足 ， 从 而 造成 操作 失败 ， 或 者 在 进行 擦 除 操作 时 不 合适 的 电压 将 电子 释放 得 不 够 彻 
底 ， 也 将 造成 操作 失败 ， 类 似 的 错误 称 为 写 错误 。 


2) 记忆 错误 。 当 存储 单元 通过 电 和 葵 吸 入 或 者 电 答 港 漏 等 转换 了 原来 的 辣 值 电 压 值 时 会 发 生 错 误 ， 类 似 的 错误 称 为 记忆 错误 。NAND Flash 的 晶体 管 与 晶 
体 管 之 间 容 易 彼此 影响 造成 逻辑 “0” 变 为 逻辑 “1” 从 而 发 生 位 翻转 。 

3) 读 错误 。 当 进行 读 操作 时 ， 由 于 不 稳定 的 电压 可 能 造成 存储 单元 的 逻辑 值 友 生 错误 ， 类 似 的 错误 称 为 读 错 误 。 

SLC 心 片 每 个 存储 单元 只 存储 1 位 数据 ， 对 应 两 个 电压 状态 。MLC 心 片 每 个 存储 单元 可 存储 2 位 数据 ， 对 应 4 个 电压 状态 。 由 于 SLC 与 MLC 的 电压 变化 范围 
近似 ， 从 而 SLC 的 每 个 状态 的 电压 范围 较 大 ，MLC 的 每 个 状态 的 电压 范围 较 小 。 目 前 MLC 型 NAND Flash 有 4LC (2bit per cell) 、8LC (3bit per cell) 、 
16LC (4bit per cell) 这 三 种 第 用 的 技术 。 以 4LC 为 询 ，2 位 数据 需要 用 四 种 电压 状态 来 区 分 ， 则 相应 的 状态 电压 范围 变 小 ， 只 为 SLC 技术 的 1/2， 数 据 的 稳定 
性 变 差 ,使 得 数据 随机 位 翻转 (1 变 为 0，0 变 为 1) 的 情况 增多 。 

对 于 NAND Flash 的 随机 位 翻转 现象 需要 引入 纠 错 机 制 ， 以 保证 当 数 据 出 现 误 码 时 ， 通 过 该 机 制 能 将 错误 的 数据 纠正 回来 ， 从 而 提高 其 数据 的 可 靠 性 。 


NAND Flash 纠 错 系 统 的 结构 以 及 设计 方法 通常 对 整个 系统 的 性 能 有 着 很 大 的 影响 。 本 书 主 要 介绍 通过 纠 错 码 实现 的 纠 错 技术 ， 如 采用 汉 明 码 和 BCH 线 性 
分 组 码 作 为 纠 错 码 ， 对 NAND Flash 进 行 纠 错 校 验 从 而 提高 存储 系统 的 可 靠 性 。 

传统 的 SLC 型 NAND Flash 工 艺 相对 成 熟 ， 人 存储 过 程 中 数据 出 错 的 概率 较 小 ， 并 且 误 码 位 置 较为 分 散 ， 使 用 纠 错 能 力 较 弱 的 汉 明 (Hamming) 码 作为 
ECC (Error Checking and Correcting， 错 误 检查 和 纠正 ) 纠 错 码 即 可 满足 系统 要 求 ; 对 于 MLC 型 NAND Flash 而 言 ， 每 个 存储 单元 中 存储 多 个 数据 ， 位 之 
间 的 影响 使 得 出 错 概率 增加 ， 可 能 会 出 现 连 续 的 位 翻转 错误 ， 所 以 需要 比 汉 明码 纠 错 能 力 更 强 的 BCH 码 或 者 Reed-Solomon 码 作为 ECC 纠 错 码 来 保证 存储 和 传 
输 过 程 中 数据 的 正确 性 。 下 面 分 别 介绍 这 三 种 NAND Flash 中 常用 的 纠 错 码 。 


7.1.2 ” 汉 明 码 


汉 明 码 是 R.Hamming 提 出 的 一 种 可 以 纠正 一 位 错误 的 差错 控制 编码 。 了 解 汉 明 码 之 前 ， 先 简单 介绍 奇偶 校 验 码 的 实现 原理 。 


假设 信息 位 为 K=n-1 位 ， 表 示 为 a1 ~ an-1， 加 上 一 位 偶 校 验 位 ( 宛 余 位 ) a0， 构 成 一 个 n 位 的 码 字 a0 ~ an-1。 在 接收 端 校 验 时 ， 可 按 关系 式 
S=a0+a1+a2.…+an-1 来 计算 。 若 S=0， 则 无 错 ; 若 S=1， 则 有 错 。 上 式 可 称 为 监督 关系 式 ，S 称 为 校正 因子 。 在 奇偶 校 验 情况 下 ， 只 有 一 个 监督 关系 式 和 一 个 
校正 因子 ， 其 取 值 只 有 两 种 ， 即 0 或 1， 分 别 代表 无 错 和 有 错 的 情况 ， 而 不 能 指出 差错 所 在 的 位 置 。 不 难 想象 ， 若 增加 宛 余 位 ， 则 相应 地 增加 监督 关系 式 和 校正 
因子 ， 就 能 区 分 更 多 的 情况 。 若 有 两 个 校正 因子 ， 则 其 取 值 就 有 4 种 可 能 : 00、01、10 或 11， 就 能 区 分 4 种 不 同情 况 。 若 其 中 一 种 表示 无 错 ， 另 外 三 种 不 但 可 
以 用 来 指出 有 错 ， 还 可 以 用 来 区 分 错误 的 情况 ， 如 指出 是 哪 一 位 出 错 等 。 

如 果 NAND Flash 的 随机 位 翻转 特性 只 会 造成 1 位 或 者 几 位 数据 出 错 ， 而 且 出 错位 置 较为 随机 ， 则 可 以 将 一 页 的 数据 分 为 多 个 数据 块 进行 汉 明 码 校 验 ， 在 
很 大 程度 上 实现 对 随机 位 翻转 造成 的 误 码 控制 ， 因 此 我 们 选择 汉 明 码 校 验 来 确保 SLC 型 NAND Flash 数 据 传输 的 稳定 性 和 可 靠 性 。 


1. 汉 明码 简介 


汉 明 码 是 电信 领域 的 一 种 线性 分 组 码 ， 以 帮 明 者 Richard Wesley Hamming 的 名 字 命 名 。 
传统 的 奇偶 校 验 只 能 检测 到 数据 块 的 奇数 个 位 出 错 并 且 不 能 纠 错 ， 


行列 奇偶 校 验 信息 作为 校 验 码 进行 校 验 。 
误 ， 还 能 在 1 位 出 错时 具有 纠 错 能 


2. 编 码 原 理 


名 一 个 数据 块 的 大 小 为 n 字 节 
位 求 异 或 ， 各 结果 为 0， 则 表明 含有 偶数 个 1 


以 64 字 蔬 的 数据 块 (64x8 位 ) 为 例 ， 编 码 规则 如 图 7-1 所 示 。64 字 


公式 为 : 


m=21l0og>n 


， 处 理 位 宽 选 择 为 字 节 宽度 (8 位 ) ， 
名 结果 为 1， 则 表明 含有 奇数 个 1。 


是 从 传统 的 奇偶 校 验 友 展 而 来 的 ， 主 要 是 将 数据 块 的 
而 汉 明 码 校 验 不 仪 能 够 检测 到 该 数据 块 的 2 位 错 


汉 了 明码 校 验 


则 汉 明 码 校 验 每 次 对 n 字 节 的 数据 块 的 校 验 操作 包含 列 校 验 和 行 校 验 。 对 每 个 待 校 验 的 


节 的 数据 块 即 为 包含 64 行 和 8 列 的 矩阵 ， 和 矩阵 中 每 个 元 素 表示 一 位 。 校 验 码 位 数 的 计算 


其 中 mn 代 表 校 验 和 矩阵 的 行 / 列 数 ，m 代 表 相 对 应 的 行 / 列 校 验 码 数目 。 


| | 
bit4 jbit3 Jbit2 bitl JbitO rmpl _ 
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1t7 it5 1t4 1 | bitO 7 
t 上 本 于 
| 
| i 


bit6 
[re 


bit6 


所. | 9. | 号 .| 吕 .| 三. 
| | | 
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= ey ey 
4 sd bs | es ss . 
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二 | 一 ie | +. |es 
wl |B IS 
| | 
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二 | 二 ey eg 
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图 7-1 行列 校 验 图 

通过 计算 可 知 ， 对 于 大 小 为 64x8 位 的 数据 块 而 言 ， 汉 明码 的 编码 过 程 会 产生 6 位 列 校 验 码 和 和 12 位 行 校 验 码 。 利 用 CP0 ~ CP5 代 表 6 个 列 校 验 码 ，RP0 ~ 


RP11 代 表 12 个 行 校 验 码 。 


如 图 7-1 所 示 ， 对 于 i=0， 1 “0 5 而 言 ， 
素 通 过 异 或 运算 得 到 的 。 例 如 ，bit0、bit2、 


列 标识 cpi 表 示 该 列 所 有 元 泰 都 参与 了 列 校 验 码 CPI 的 产生 运算 ， 也 就 是 说 列 校 验 码 CPi 是 由 列 标识 为 cpi 的 所 有 元 
bit4、bit6 所 在 的 第 9、2、4、6 列 都 标识 了 cp0， 这 说 明 CP0 的 值 需要 这 四 列 的 所 有 元 素 进行 异 或 运算 得 到 。 表 比 


如 标识 cp3 的 列 为 bit2、bit3、bit6、bit7 所 在 的 第 2、3、6、7 列 ， 则 列 校 验 码 CP3 的 值 需要 第 2、3、6、7 列 的 所 有 元 素 进 行 异 或 运算 来 得 到 。 


同 理 ， 行 校 验 码 的 产生 也 是 一 样 的 。 对 于 i=0，1，.… 


，11 而 言 ， 行 校 验 码 RPi 是 由 行 标识 为 rpi 的 所 有 元 素 通过 异 或 运算 得 到 的 ， 比 如 byte0、byte2、 


byte4、...、byte62 所 在 的 偶数 行 都 标识 了 rp0， 那 么 RP0 的 值 需 要 这 些 偶数 行 中 的 所 有 元 素 进行 异 或 运算 得 到 。 再 比如 ， 前 32 行 的 所 有 元 素 的 都 标识 为 rp10， 


那么 RP10 融 是 前 32 行 的 所 有 元 素 进 行 异 或 运算 的 结果 。 
(1) 列 校 验 位 


CP0 是 第 0、2、4 和 第 6 列 中 各 元 素 求 异 或 的 结果 ; CP1 为 第 1、 


第 1、3、5、7 列 的 极 性 ; CP2 为 第 9、1、 


因此 ，CP0 ~ CP5 的 产生 可 表示 为 如 下 公式 : 


4、5 列 的 极 性 ; CP3 为 第 2、3、6、7 列 的 极 性 ; CP4 为 第 0、1、 


3、5 和 第 7 列 中 所 有 元 素 求 异 或 的 结果 。 由 此 可 得 : 
2、3 列 的 极 性 ; CP5 为 第 4、5、6、7 列 的 极 性 。 


CP0 为 第 9、2、4、6 列 的 极 性 ;CP1 为 


CPO=b1i1t0 Wb1t2 Wb1t4Wb1t6 
CP1=blit1@9blit3 申 blt$@ 申 blt7 
CP2=bit0@bitl@bit4@b1tS 
CP3=b1t2@b1t3Bb1it6WDb1t7 
CP4=b1t0Wb1tl Bb1t2DDb1t3 
CPS=b1it4@b1tSDBbit6WDb1t7 


以 CP0 的 产生 过 程 为 例 ， 可 以 理解 为 第 0 列 内 部 64 位 异 或 之 后 再 与 第 2 列 64 位 异 或 ， 表 与 第 4 列 、 第 6 列 的 每 位 异 或 。 或 者 也 可 以 等 效 为 先 计算 每 一 行 的 第 0 
列 、 第 2 列 、 第 4 列 和 第 6 列 的 位 异 或 得 到 CPi0 (0<i<63) ， 再 将 64 行 的 各 行 CPi0 异 或 结果 相 异 或 得 到 CP0。 因 此 ， 当 接收 到 第 i 个 数据 时 ， 可 以 通过 对 该 数 特 
定位 的 运算 先 得 到 该 数 内 部 的 CPi0、CPi1、CPi2、CPi3、CPi4、CPi5， 将 其 与 前 i 个 数 得 到 的 结果 再 进行 异 或 ， 以 此 类 推 直到 接收 完 第 63 个 数 之 后 ， 得 到 的 异 
或 结果 即 为 该 数据 块 进行 汉 明 码 编码 得 到 的 列 校 验 码 。 

(2) 行 校 验 位 


假设 数据 块 和 矩阵 中 第 j 行 的 序号 表示 为 Rnum[jj，Rnum[j] 是 一 个 8 位 宽 的 变量 ， 各 位 分 别 表 示 为 bitR_7[] ~ bitR_0[]， 其 对 应 关系 如 表 7-1 所 示 。 


表 7-1 行 序号 中 各 位 的 对 应 关系 


同样 以 64x 8 位 的 数据 块 为 例 。byte0 的 行 序号 Rnum 为 0， 也 即 bitR_7~ bitR_0 均 为 0，byte15 的 行 序号 Rnum 为 15 (二 进 制 表示 为 00001111) ， 也 即 
bitR_7~ bitR_4 为 0，bitR_3~ bitR_0 为 1。 定 义 行 极 性 为 该 行 中 各 位 的 异 或 结果 ， 则 所 有 的 行 校 验 码 都 可 由 需要 参与 运算 的 各 个 行 的 行 极 性 互相 异 或 得 到 。 





如 图 7-2 表 示 大 小 为 64x 8 位 的 数据 块 中 各 个 行 校 验 码 与 行 序号 的 关系 示意 图 ，64x 8 位 的 数据 块 在 汉 明 码 编码 过 程 中 会 产生 12 个 行 校 验 位 ， 假 设 各 行 的 行 
极 性 如 图 7-2 中 所 示 。 由 图 可 知 ， 参 与 RP0/RP1 运 算 的 数据 行 完 全 由 行 序号 中 的 bitR_0 决 定 ， 而 参与 RP2/RP3 运 算 的 行 完全 由 数据 对 应 行 序 号 中 的 bitR_1 决 
定 ， 类 推 得 到 参与 RP4/RP5 运 算 的 行 完 全 由 行 序号 中 的 bitR 2 决定 ， 参 与 RP6/RP7 运 算 的 行 则 完全 由 行 序号 中 的 bitR_ 3 决定 ， 参 与 RP8/RP9 运 算 的 行 则 完全 由 
行 序号 中 的 bitR_3 决 定 ， 参 与 RP10/RP11 运 算 的 行 则 完全 由 行 序号 中 的 bitR_3 决 定 。 例 如 ，RP1 为 所 有 奇数 行 中 的 元 素 进行 异 或 运算 得 到 ， 也 即 若 判断 得 到 某 
行 行 序号 中 bitR 0=1， 那 么 该 行 参与 RP1 的 计算 ; 而 RP5 为 所 有 行 序 号 中 bitR 2=1 的 行 中 所 有 元 素 进行 异 或 运算 得 到 ， 也 即 若 判 断 得 到 某 行 行 序号 中 
bitR_ 2=1， 那 么 该 行 参与 RP5 的 计算 。 因 此 可 以 概括 为 ，RP1、RP3、RP5、RP7、RP9、RP11 分 别 为 满足 行 序号 中 bitR 0=1、bitR 1=1、bitR 2=1、 
bitR 3=1、bitR 4=1、bitR_5=1 的 各 个 行 中 所 有 元 素 的 异 或 结果 。 


| 抹 极 性 |bitR_7|bitR_6|bitR_5|bitR 4 | bitR_3 |bitR_2 |bitR_ lbiR0l | | | | | 
eo 0 0 000 
bytel | 0 | 0 10 | 010 | 0 
byte2 | 0 | 0 | 0 10 | 0 | 0 
byte3 | 1 | 0 10 |0 | 0 | 0 





图 7-2 行 校 验 码 与 行 信号 的 关系 
在 图 7-2 的 基础 上 ， 以 RP1 为 例 进行 说 明 。 
RP1 为 满足 bitR_0=1 的 各 个 行 中 所 有 元 素 的 噶 或 结果 ， 即 各 个 行 的 行 极 性 相 异 或 ， 也 可 以 表示 为 RP1=^ (第 行 行 极 性 &bitR_0[]) 。 对 于 寞 或 运算 来 说 ， 
与 0 异 或 对 结果 没有 影响 。 所 以 只 有 当 行 极 性 和 bitR_0 都 为 1 的 行 才 会 对 行 校 验 位 的 结果 产生 影响 。 因 此 ，RP1 可 以 用 两 种 方式 来 计算 : 
1) 筛选 出 bitR_0=1 的 行 ， 将 这 些 行 的 行 极 性 进行 异 或 。 


2) 筛选 出 行 极 性 =1 的 行 


前 


将 这 些 行 的 bitR_ 0 进行 异 或 。 


一 般 情 况 下 纠 错 会 产生 多 个 行 校 验 位 ， 利 用 方式 1 需要 进行 多 次 判断 ， 而 方式 2 仪 需 进行 一 次 行 极 性 的 判断 ， 较 为 简洁 。 同 理 ，RP3、RP5、RP7 的 计算 可 
以 通过 先 筛选 出 行 极 性 为 1 的 行 ， 再 将 这 些 行 的 行 序号 的 bitR_1、bitR_2、bitR_3 进 行 异 或 运算 得 到 。 因 此 ， 若 将 行 极 性 为 1 的 行 序号 按 位 进行 异 或 ， 所 得 结果 
的 低 4 位 中 由 低 到 高 分 别 为 RP1、RP3、RP5、RP7、RP9、RP11 的 值 。 


行 校 验 位 中 RP0、RP2、RP4、RP6、RP8、RP10 对 应 的 分 别 为 bitR_0=0、bitR 1=0、bitR 2=0、bitR 3=0、bitR 4=0、bitR_ 5=0 的 行 的 运算 结果 。 以 
RP0 为 例 ，RP0 为 满足 bitR_ 0=0 且 行 极 性 为 1 的 行 的 异 或 结果 ， 可 表示 为 RP0= 人 (第 行 行 极 性 & (~bitR_ 0) ) 。 类 似 于 之 前 所 述 的 RP1 的 计算 ， 因 此 RP0、 
RP2、RP4、RP6、RP8、RP10 可 以 利用 先 筛 选 行 极 性 为 1 的 行 ， 表 将 这 些 行 的 行 序号 按 位 取 肥 之 后 进行 异 或 运算 得 到 |。 


利用 上 述 编码 原理 共 得 出 12 位 行 校 验 码 和 6 位 列 校 验 码 ， 这 18 位 的 校 验 码 即 为 数据 块 的 原始 校 验 码 。 


3. 译 码 原 理 


在 利用 汉 明 码 对 数据 块 进行 校 验 时 ， 需 要 对 每 个 数据 块 (64x 8 位) 重新 生成 一 次 汉 明 校 验 码 ， 我 们 可 以 称 之 为 新 校 验 码 。 新 校 验 码 的 生成 与 原始 校 验 码 
的 生成 完全 一 致 ， 具 体 原 理 参 见 前 面 内 容 。 


译 码 过 程 中 对 数据 块 的 误 码 检测 以 及 纠 错 是 根据 新 校 验 码 与 原始 校 验 码 进行 判断 的 。 将 新 校 验 码 与 该 数据 块 的 原始 校 验 码 按 位 异 或 ， 奋 18 位 的 异 或 结果 都 
为 0， 则 表示 没有 检测 到 误 码 ， 若 18 位 校 验 码 的 异 或 结果 中 存在 9 位 ( 校 验 码 个 数 的 一 半 ) 为 1， 表 示 检 测 到 了 1 位 误 码 ， 且 可 纠正 ; 大 18 位 校 验 码 的 异 或 结果 
中 只 有 一 位 为 1， 表 示 校 验 码 出 现 了 误 码 ， 数 据 块 中 未 检测 到 误 码 ;其 他 情况 均 表示 出 现 了 无 法 纠正 的 错误 。 


将 18 位 的 校 验 码 存 放 于 三 个 校 验 字 节 中 ， 其 对 应 关系 如 表 7-2 所 示 。 


表 7-2 校 验 字 市 与 校 验 码 对 应 关系 


RP0 


假设 ecc_ code raw[2: 0][7: 0] 保 存 原始 校 验 码 ，ecc code new[2: 0][7: 0] 保 存 新 校 验 码 ， 对 ecc code raw[2: 0] 和 ecc code new[2: 0] 进 行 按 位 异 
或 操作 可 得 到 3 字 节 的 结果 ， 将 这 3 字 节 分 别 保 存在 s2、s1、s0 中 ， 如 果 s0、s1、s2 中 共有 9 位 为 1， 则 表示 出 现 了 一 个 位 错误 ， 可 以 修正 。 若 s0、s1、s2 中 1 的 
总 个 数 不 为 9 也 不 为 0， 则 检测 到 了 2 位 的 错误 。 而 对 于 更 多 位 的 错误 ， 汉 明码 无 法 检测 出 来 。 


所 以 如 果 新 校 验 码 与 原始 校 验 码 异 或 运算 的 结果 中 为 1 的 位 正好 为 总 校 验 码 个 数 的 一 半 ， 则 说 明 该 数据 块 中 出 现 了 1 位 误 码 。 错 误 位 的 定位 类 似 于 二 叉 树 的 
原理 。 根 据 RP10 和 RP11 可 将 错误 位 置 定位 在 半 个 区 域 中 ,再 根据 RP8 和 RP9 又 可 以 进一步 定位 在 某 个 1/4 区 域 范 围 内 ， 以 此 类 推 直到 最 后 根据 RPO 和 RP1 准 确 
地 定位 到 该 错误 位 所 在 的 行 ， 同 理 ， 用 这 个 方法 可 以 定位 到 错误 位 所 在 的 列 。 


下 面 举 例 进行 说 明 。 
假设 待 校 验 的 数据 为 两 字 节 : 0x57 (二 进 制 为 01010111) 和 0x9a (二 进 制 为 10011010) ， 其 行列 校 验 码 如 图 7-3 所 示 。 


从 图 7-3 中 可 以 计算 出 CP5~CP0 的 值 ， 记 为 原始 数据 列 校 验 位 。 假 设 0x9a 的 一 个 数据 位 发 生变 化 变 成 0xX92， 也 即 byte1 的 bit3 出 错 。 此 时 再 计算 各 个 列 校 
验 位 ， 记 为 变化 后 数据 列 校 验 位 。 如 表 7-3 所 示 。 





图 7-3 ”位 误 码 数据 的 校 验 
表 7-3 列 校 验 位 变化 表 


原始 数据 校 验 位 1 0 
变化 后 数据 列 校 验 |1 | | | 
性 异 或 的 结果 "oO lo | 


从 表 7-3 得 知 ， 当 数据 块 中 byte1 的 bit3 发 生变 化 后 ， 只 有 CP1、CP3 和 CP4 发 生变 化 ， 也 即 只 有 一 半 的 列 校 验 位 故 生 了 变化 。 由 于 检测 的 是 单 比特 的 误 
码 ， 所 以 在 译 码 过 程 中 ， 如 果 异 或 结果 中 CP4 为 1 则 CP5 一 定 为 0%， 那 么 在 上 例 中 可 以 将 误 码 位 所 在 列 定 位 在 bit3~bit0 所 在 的 列 中 ; 同 理 CP2 与 CP3 之 间 也 只 会 
有 一 个 发 生变 化 ， 例 中 CP3 发 生变 化 ， 则 将 错误 位 所 在 列 进一步 定位 在 bit3 和 bit2 所 在 的 这 两 列 中 ; 最 后 根据 CP1 和 CP0 中 只 有 CP1 发 生变 化 ， 最 终 确 定 了 误 码 
位 在 bit3 所 在 的 列 。 异 或 结果 中 CP5/CP3/CP1 的 值 为 011， 转 换 为 十 进 制 数 为 3， 即 定位 错误 位 所 在 列 为 第 3 列 (从 第 0 列 计 起 ) 。 因 此 ， 利 用 相 异 或 结果 中 的 
CP5/CP3/CP1 即 可 定位 误 码 所 在 的 列 。 


对 于 行 校 验 码 也 是 一 样 的 道理 。 当 数据 块 中 byte1 的 bit3 友 生变 化 后 ， 行 校 验 码 RP1 发 生变 化 ， 而 RP0 保 持 不 变 。 因 此 原始 行 校 验 码 与 新 行 校 验 码 的 异 或 结 
果 中 只 有 RP1 为 1， 这 样 融 将 误 码 所 在 的 行 定 位 在 byte1 所 在 的 行 中 。 因 此 可 判断 出 误 码 为 byte1 中 的 bit3， 只 需 对 该 位 取 反 ， 即 可 实现 纠 错 。 


综 上 所 述 ， 对 于 汉 明 码 校 验 而 言 ， 纠 正 误 码 位 的 方法 是 : 先 确定 列 地 址 ( 即 哪 一 列 出 错 ) ， 再 确定 行 地 址 〈 即 哪 一 行 出 错 ) ， 最 后 对 定位 到 的 误 码 取 反 。 
确定 行 地 址 的 方法 是 抽取 异 或 结果 中 列 校 验 码 的 奇数 位 ， 然 后 由 高 位 至 低位 构成 一 个 新 的 数 ， 该 数值 表示 误 码 位 所 在 的 行 地 址 ;确定 列 地 址 的 方法 是 抽取 异 或 
结果 中 行 校 验 码 的 奇数 位 ， 再 由 高 位 至 低位 构成 一 个 新 的 数 ， 该 数值 表示 误 码 所 在 的 行 地 址 。 


7.1.3 BCH 人 码 


1.BCH 码 简介 


BCH 码 是 一 种 循环 码 ， 可 以 用 于 纠正 多 位 随机 错误 。BCH 码 的 友 明 人 有 三 个 : 博 斯 (Bose) 、 雷 - 查 德 胡 里 (Ray Chaudhuri) 和 霍 昆 格 姆 
(Hocquenghem) ， 他 们 各 自 于 1959 年 和 1960 年 分 别提 出 了 能 纠正 多 个 随机 错误 的 循环 码 的 构造 方法 ， 后 来 以 三 人 名 字 的 首 字母 将 其 命名 为 BCH 码 。BCH 


码 是 迄今 为 止 所 发 现 的 一 类 很 好 的 线性 纠 错 码 ， 它 解决 了 生成 多 项 式 与 纠 错 能 力 的 关系 问题 ， 可 以 在 给 定 纠 错 能 力 要求 的 条 件 下 寻找 码 的 生成 多 项 式 ， 有 了 生 
成 多 项 式 ， 编 码 的 问题 就 解决 了 。1960 年 ，Peterson 从 理论 上 解决 了 二 进 制 BCH 码 的 译 码 算 法 ， 由 此 莫 定 了 BCH 码 译 码 的 理论 基础 。1966 年 ，Berlekamp 利 
用 友 代 算法 译 码 ， 从 而 大 大 加 快 了 BCH 码 的 译 码 速度 ， 从 实际 上 解决 了 BCH 码 的 译 码 问题 。1971 年 ，Herbert O.Burton 提 出 了 无 求 闻 的 Berlekamp Massay 
迭代 算法 ， 解 决 了 迭代 译 码 算法 中 的 求 逆 问题 ， 进 一 步 提高 了 BCH 码 的 译 码 效率 。 


BCH 码 纠 错 能 力 强 ， 尤 其 是 在 短 和 中 等 码 长 下 其 性 能 接近 于 理论 值 ， 具 有 构造 方便 、 编 码 简单 、 有 快速 译 码 算 法 且 能 够 利用 线性 移 位 寄存 器 来 实现 等 特 
上 挟 。 基 于 BCH 码 的 纠 错 系统 由 编码 和 译 码 两 部 分 构成 ， 其 中 编码 是 根据 信息 位 计算 得 到 校 验 位 的 过 程 ， 而 译 码 是 由 计算 伴随 式 、 求 解 错误 位 置 多 项 式 和 Chien 
搜索 三 个 部 分 组 成 。 以 下 针对 BCH 码 的 编译 码 原 理 等 进行 研究 。 


2.BCH 码 基本 原理 
BCH 码 能 够 纠正 多 个 随机 位 错误 ， 它 具有 很 严密 的 代数 结构 ， 根 据 所 要 求 的 纠 错 能 力 t， 束 可 以 构造 出 相应 的 BCH 码 。 


BCH 码 的 定义 如 下 : 给 定 任 一 有 限 域 GF (q) 及 其 扩 域 GF (q") ,其 中 q 是 素数 或 是 素数 的 吉 ，m 是 一 个 正 整数 ， 若 对 于 任意 码 元 取 自 GF (q) 上 的 一 循 


-mm mt+l m+2 m+6—2 
C 0 0 0 Oo 0 站 0 
{ 9 » 9 9 


环 码 C (n，k) ，n=q…1， 它 的 生成 多 项 式 个 g9 (x) 的 根 集合 R 中 含有 8-1 个 连续 根 ， 当 R 包 含 } 时 ， 则 将 由 g (x) 生成 的 循环 码 称 


7 十 ] mW +2 , 


m, 7 1 十 0O-2 
为 q 进 制 BCH 码 。 其 中 & ;9 ,QQ “” 均 为 扩 域 GF (qm) 中 的 元 素 。m0 为 任意 整数 ， 但 对 于 最 常见 的 情况 ，mo=0 或 1。 若 mo=0， 则 这 类 
BCH 码 称 作 狭 义 BCH 码 。 


10 十 7 


设 mi (x) 和 e 份 别 是 ” (一 0,1 20) 的 最 小 多 项 式 和 级 ， 则 此 BCH 码 的 生成 多 项 式 和 码 长 分 别 为 : 
g(x)=LCM(mo(x),m 1(X) :77 ,(X) 9 ,1 ;_»(X)) 
n=LCM(eo ,1 ,C2) | ,CE5 7) 


陈 中 LCM 表 示 最 小 公 倍数 多 项 式 。 


如 果 生 成 多 项 式 g (x) 的 根 中 ， 有 一 个 GF (q") 的 本 原 域 元 素 ， 则 n=q …-1， 这 种 码 长 为 9 …1 的 BCH 码 为 本 原 BCH 码 ， 否 则 称 为 非 本 原 BCH 码 ，BCH 码 
的 最 小 距离 为 8。 


在 之 前 介绍 的 q 进 制 BCH 码 中 ， 最 常用 的 是 码 元 取 自 GF (2) 上 的 二 进 制 BCH 码 。 令 6 为 2t+1，mo 为 1， 这 样 得 到 的 函数 正好 可 以 纠正 t 个 错误 。 若 码 以 


Q1，a*，...Q<t， 为 根 ， 则 二 进 制 BCH 码 的 生成 多 项 式 为 : 
g(x)=LOCM(mo(x), mi (x), mo (Xx), ,mxX)) 


其 中 mi (x) 是 al (1<i<2t) 的 最 小 多 项 式 ， 由 于 在 特征 为 2 的 GF (2m) 域 上 ，c 与 a2! 一 者 互 为 共 罗 ， 它 们 具有 相同 的 最 小 多 项 式 ， 所 以 生成 多 项 式 可 以 
改写 为 : 


g(x)=LCM(mi (0),ms (0), m2(X),*, m2 (0)) 


因此 二 进 制 BCH 码 以 a1，a<，...Q*! 为 根 ， 码 长 为 n=2"m-1 (m>3) ， 检 验 和 矩阵 为 : 


nm-j 一 2 ] 


(Q ) 一 (CQ 一 加 ey” ] 
(C 一 a (a 有 加 (x 1 


通过 以 上 BCH 码 的 简介 ， 我 们 总 结 生 成 多 项 式 g (x) 的 推导 如 下 : 

1) 确定 有 限 域 GF (2") 的 一 个 本 原 元 c、 阶 n=2 1 和 设计 距离 t。 

2) 确定 有 限 域 GF (2…) 的 本 原 多 项 式 P (x) ， 令 P (oa) =0， 本 原 多 项 式 可 通过 查 表 得 知 。 
3) 由 本 原 多 项 式 p (x) 生成 该 GF (27) 域 上 的 所 有 元 素 。 

4) 将 根 {a1，a*，03，...，a?1，a 人 在 GF (2m) 内 分 成 共 罗 根 组 。 

5) 根据 共 斩 根 组 确定 最 小 多 项 式 mi (x) 。 

6) 生成 多 项 式 g (x) =m1 (x) :m3 (xX) …m2t-1 (X) 

对 于 码 长 为 n、 信 息 位 为 k、 可 纠正 t 个 误 码 的 二 进 制 BCH 码 而 言 ， 其 参数 如 下 : 

1) 码 长 : n=2m-1 (m>3) 

2) 一 致 校 验 位 : n-k<mt 

3) 最 小 汉 明 距离 : dmin>2t+1 

最 小 汉 明 距离 是 所 构造 的 BCH 码 要 达到 的 码 间距 离 ， 该 码 最 多 能 纠正 n 个 码 元 组 中 的 t 个 错误 ， 因 此 称 它 为 纠正 t 个 误 码 的 BCH 码 。 
3. 编 码 原理 


由 纠 错 码 理论 可 知 ，BCH 码 可 以 通过 下 式 的 乘法 实现 : 


C(x)=m(x) :8G) 


其 中 ，C (x) 指 的 是 编码 后 的 码 字 ， 长 为 n，m (x) 是 k-1 次 信息 多 项 式 ，g (x) 是 n-k 次 循环 码 生 成 多 项 式 。 


将 BCH 的 编码 结果 设计 成 前 面部 分 是 k 位 的 原始 数据 信息 ， 后 面部 分 是 (n-k) 位 的 校 验 信息 ， 因 此 BCH 码 的 编码 过 程 实际 上 是 由 信息 位 经 生成 矩阵 计算 
得 到 由 信息 和 校 验 码 组 成 的 码 字 的 过 程 。 比 较 容易 实现 的 方式 是 将 信息 码 多 项 式 升 n-k 次 突 后 除 以 生成 多 项 式 ， 然 后 将 所 得 余 式 置 于 升 窜 后 的 信息 多 项 式 之 
后 。 具 体 编码 过 程 如 下 所 述 。 


令 信 息 位 为 m (x) ， 其 长 度 为 k。 现 对 m (x) 进行 编码 ， 即 要 构造 纠 错 能 力 为 {的 BCH 码 (n，k，t) ， 其 生成 多 项 式 为 9 (X) 。 首 先 将 信息 位 m (x) 乘 
以 x"k， 然 后 将 乘积 的 结果 除 以 生成 多 项 式 g (x) ， 可 以 得 到 如 下 公式 : 


xX" ‘xm(x) 70) 


= + 
g(x) g(x) 


这 里 q (x) 为 除法 运算 的 商 , r(x) 表示 除法 运算 的 余数 。 由 上 式 可 得 循环 码 多 项 式 : 


q(x) 


q(x) x g(x)=x" x m(x)+r(x) 


由 上 式 可 以 知道 9 (x) xg (x) 是 仅 以 qa1，a<，...，a*! 为 根 的 n 次 多 项 式 ， 即 为 BCH 码 字 ， 而 r (x) 就 是 码 字 的 校 验 位 ， 其 长 度 为 n-k。 那 么 BCH 编 码 的 
码 字 c (x) 即 为 : 


C(x)=x" x m(x)+r(x) 


如 果 码 生成 多 项 式 为 


g(x)= ] 十 CIX 十 ， 站 to px lyk 


2 k 
Mm(xX)=motm xt+m x +***mx 


则 编码 过 程 由 下 面 几 步 生成 : 
第 一 步 : 用 x"K 乘 以 信息 多 项 式 m (x) 。 

第 二 步 : 用 生成 多 项 式 g (x) 除 以 x"Km (x) 得 到 余 式 b (x) 。 

第 三 步 : 由 x"Km (x) +b (x) 得 到 BCH 码 

以 一 个 简单 的 例子 对 BCH 码 的 编码 过 程 进行 如 下 说 明 : 

若 生成 多 项 式 为 9 (x) =1+x4+x6+x/+x8， 需 要 构造 BCH (15，7，3) 码 字 ， 现 在 对 信息 位 m (1011011) 进行 编码 ， 其 编码 步骤 为 : 
第 一 步 : 先 用 x15-7 乘 以 信息 位 ， 得 到 m (x) x15-7= (101101100000000) 。 


第 二 步 : 用 生成 多 项 式 g (x) 除 以 上 一 步 得 到 的 结果 来 计算 校 验 位 ， 得 到 余数 表达 式 r (x) = (m (x) x8) mod g(x) = (01101101) ， 余 数值 即 为 校 


第 三 步 : 综合 信息 位 与 校 验 位 得 到 BCH 码 码 字 为 c (x) = (101101101101101) 。 
4. 译 码 原 理 


相对 于 编码 而 言 ，BCH 译 码 的 设计 更 加 复杂 ， 也 一 直 是 编码 理论 研究 中 的 热点 之 一 。 译 码 的 主要 思想 是 用 GF (2m) 中 的 元 素 给 码 字 中 的 位 置 编号 ， 然 后 
应 用 GF (2m) 计算 ， 通 过 解 方程 组 来 找到 错误 的 位 置 并 纠正 。 


令 编码 器 发 送 的 编码 码 字 c (x) =co+c1X+c2X<+.…cn-1x" 1。 假 设 码 字 在 传输 的 过 程 中 受到 了 外 界 的 干扰 ， 产 生 了 如 下 错误 模式 的 接收 向 量 : 


e(X)=este xtex ++e, xX" 
( ) 0) “] 六 用 一] 


因此 ， 译 码 器 接收 到 的 向 量 R_ (x) 可 以 由 友 送 码 字 与 错误 向 量 来 表示 : 


R(X)=c(Xx)+e(x) 





如 果 要 纠正 n 个 误 码 ， 则 需要 2t 个 校正 子 Si， 可 由 S= (S1，S2，.…，S2t) =RxH 得 到 ， 也 可 以 用 下 面 的 公式 求 得 : 


RX) Sn 
W, vy, (x) -Qt VW, w(x) ， 


上 陈 中 Qi (x) 为 接收 向 量 除 以 最 小 多 项 式 ; (x) 的 商 ，Si (Xx) 为 其 余数 。 将 公式 中 等 号 两 边 的 分 母 相 消 ， 得 到 校正 子 S 的 表达 陈 为 : 


S(X)=R(xX)TO(xX)(xX),1 Si 21 
将 ac1，o3，.…，ocet1 代 到 上 述 公 式 中 ， 因 为 由 (x) 是 a 的 最 小 多 项 式 ， 则 有 由 ; (Ql) =0， 那 么 可 得 到 下 式 : 
S(0)=R(o)+O(o Wo Ra),l <i<2t 
人 
S(0)=R(a)=c(a)+e(a)=e(a),l <i< 2 
假设 译 码 器 接收 到 的 码 字 向 量 中 有 v (vxt) 个 错误 ,假设 错误 模式 e (x) 在 位 置 xe1，xS，...，xSY 上 有 v 个 错误 ， 则 可 以 得 到 如 下 等 式 : 
e(X)=X ',X 十 十 X 


其 中 0<e1<e2< <evsn。 因为 82 一 9 ， 所 以 只 需要 求 出 S，(i 为 奇数 ) 就 能 够 得 到 全 部 的 校正 子 ， 仿 X-ael， 代 入 上 边 的 两 个 公式 可 以 得 到 以 下 方 各 


9 = 不 十 筷 十 … 十 系 
9 = 不 -十 生 - 十 … 十 不- 


9 一 和 十 大 十 十 和 


求解 出 校正 子 S 的 值 后 ， 若 有 任意 S$ 的 值 不 为 0%， 则 说 明 接 收 到 的 码 字 中 有 错误 ,需要 对 码 字 进 行 纠 错 操 作 。 


定义 错误 位 置 多 项 式 为 0 (x) ， 令 其 根 的 倒数 为 错误 位 置 数 ， 那 么 : 


ox)=| [QO+Xx)=1+tox +.…+O,x 


由 此 可 以 确定 校正 子 的 值 与 错误 位 置 多 项 式 的 系数 oj 之 间 的 关系， 并 得 到 如 下 关系 : 


DytoOd ,+ +01=0 


通过 上 式 束 可 以 求 得 错误 位 置 多 项 式 ， 错 误 位 置 多 项 式 的 根 的 倒数 即 为 错误 位 置 。 对 于 二 进 制 BCH 码 而 言 ， 利 用 搜索 多 项 式 0 (x) 根 的 方法 不 仅 能 够 定位 
着 误 位 置 ， 而 且 可 以 纠正 错误 。 


综 上 所 述 ， 可 将 二 进 制 BCH 码 的 译 码 过 程 概括 为 以 下 几 个 步骤 : 

第 一 步 ， 利 用 接收 到 的 R (x) 计算 出 伴随 式 S。 

第 二 步 ， 利 用 伴随 式 S (x) 对 关键 方程 求解 ， 求 出 o (x) 。 

第 三 步 ， 用 Chien 搜 索 求 解 出 错误 位 置 。 

为 了 确定 错误 位 置 多 项 式 o (x) 的 根 ， 从 而 找到 出 错 的 位 置 ， 可 以 利用 Chien 搜 索 法 来 寻找 。 

设 R (x) =Rn_1xnT+Rn_2xn“+.…+R1X+RO， 要 检验 第 一 位 Rn-1 是 否 错误 ， 相 当 于 要 检验 am- 1 是 否 为 错误 位 置 数 ， 或 者 说 相当 于 检验 or (m1) 是否 大 
o (x) 的 根 。 所 以 在 得 到 o (x) 以 后 ， 为 了 译 出 Rn.1， 应 首先 计算 a1q，a102，..….，Qtat， 然 后 计算 它们 之 和 是 否 为 -1。 若 是 ， 则 a"-1 是 错误 位 数 ，Rn_1 错 
误 ; 否则 ，Rn-1 正 确 。 


第 四 步 ， 根 据 得 到 的 错误 位 置 ， 将 数据 取 反 就 完成 了 纠 错 操 作 。 
7.14 ”里 德 -所 罗 门 码 


1. 里 德 -所 罗 门 码 简 介 


里 德 -所 罗 门 码 (Reed-Solomon code) 是 由 Reed 和 Solomon 两 人 于 1960 年 提出 来 的 ， 简 称 为 RS 码 。 这 是 一 类 具有 很 强 纠 错 能 力 的 多 进 制 BCH 码 ， 既 能 
纠正 随机 错误 也 能 纠正 突 友 错 误 ， 也 是 一 类 典型 的 代数 几何 码 。Rs 码 一 直 以 来 都 是 国际 通信 和 领域 研究 的 热点 之 一 。 


定义 : 在 GF (q) 上 ， 码 长 n=d-1 的 本 原 BCH 码 称 为 RS 码 。 
纠正 t 个 错误 的 RS 码 有 如 下 参数 ， 如 表 7-4 所 示 。 


表 7-4 RS 码 参 数 


但 长 n=q—1 
信息 位 长 k 

校 验 位 长 n—k=21 
字符 长 m 

最 大 纠 钳 个 数 t 

最 小 距离 d=2t+1 


RS 码 的 最 小 汉 明 距离 dmin=2t+1， 因 此 它 是 最 大 距离 可 分 码 (MDS 码 ) ， 也 就 是 说 : 在 所 有 的 线性 分 组 码 中 ，RS 码 具有 最 大 的 最 小 汉 明 距离 ， 所 以 它 的 
纠 错 能 力 是 最 强 的 。 


当 q=2"m" 时 ， 码 元 符号 取 自 有 限 域 GF (2m) 上 ， 此 时 码 元 符号 可 以 表示 成 相应 的 二 元 数组 ， 与 通常 所 用 的 二 进 制 序列 对 应 。 因 此 ，GF (2") 上 的 RS 码 是 
一 类 应 用 相当 广泛 的 RS 码 。 


在 GF (2™"m) 上 纠正 t 个 错误 的 Rs 码 的 生成 多 项 式 为 


g(x)=(x-a)(x-a’) ee (x-a’) 


其 中 ，alEGF (2m) ,i=1, 2, ...,， 2t。 


RS 码 由 于 具有 优 恨 的 纠 错 能 力 而 得 到 广泛 的 应 用 。 在 CD-ROM 等 存储 系统 中 多 来 用 RS 码 作为 纠 错 码 。 目 前 的 高 清晰 度 电 视 系 统 中 通常 用 RS 码 作为 其 级 联 


码 的 外 码 。 


A 


2.RS 编 码 算 法 


RS 码 是 一 类 循环 码 ， 其 编码 与 一 般 的 循环 码 编码 类 似 。 从 变换 域 的 角度 来 分 类 ，RS 码 的 编码 算法 有 时 域 算法 和 频 域 算法 ， 这 里 以 时 域 算 法 为 重点 进行 讨 
对 于 RS (n,，k) 码 ， 假 定 待 编 码 的 信息 矢量 M 为 : 
M=[ Mi AI ， M, AI 
即 信息 多 项 式 M (x) 为 : 
M(xV=M, YL x +NM x+M 
CI h -2 I 0 
RS 码 的 码 组 矢量 C 为 
[ =[ Ci C,_» 人 | Co | 
即 码 字 多 项 式 C (x) 为 


C(x)=C, x" +O, "+ +CX+C, 


同时 ， 已 知 RS 码 的 生成 多 项 式 g (x) 为 
21 
g(s)=| [Gt-e)=(G-o)(x-o )…(x-a ) 
| 


编码 时 ， 用 xn“M (x) 除 以 g (x) ， 所 得 的 余数 r (x) 是 校 验 多 项 式 ， 将 r (x) 置 于 信息 多 项 式 M (x) 之 后 ， 就 形成 了 RS 码 。 该 过 程 可 以 用 如 下 公式 表 


C= WOODHTCDO= MO tx MOCDmod(g(D) 


1 一 人] 


-k -1 
pp T= Mmod(g Or tr tt tr 


因此 ， 编 成 的 RS 码 为 

C=[C,i Ges = 和 Col=[Mi Mi, 四 14 /14 7 | 四 1-0| 
其 中 ， 信 息 位 为 前 k 位 ， 校 验 位 为 后 n-k 位 。 因 此 ， 采 用 这 种 方法 得 到 的 RS 码 为 系统 码 ， 这 种 算法 称 为 RS 码 的 时 域 编码 算法 ， 其 步骤 可 归纳 为 : 

1) 用 xn-k 乘 以 信息 多 项 式 M (x) ， 得 到 xn-kM (x) 。 


2) 用 x"KM (x) 除 以 生成 多 项 式 g (x) ， 取 其 余 式 ， 得 到 校 验 多 项 式 r (x) 。 


3) 联合 信息 多 项 式 M (x) 和 校 验 多 项 式 r (Xx) ， 得 到 码 字 多 项 式 C (x) 。 


RS 码 的 频 域 编码 算法 是 基于 GF (2m) 上 的 傅 里 叶 变 换 的 ， 由 这 种 算法 得 到 的 RS 码 是 非 系统 码 。 其 原理 可 以 简 述 如 下 : 设 C=[Cn_1Cn 2.…C1C0] 是 
GT Te ED we 


n—l n—2 


GF (2m) 上 纠正 t 个 错误 的 Rs 码 的 码 组 矢量 ， 为 C 在 GF (2m) 上 的 傅 里 时 变换 ，o 为 GF (2m) 的 本 原 元 ， 则 al (i=1，2， 


…，2t) 为 生成 多 项 式 的 根 ， 因 此 下 了 式 成 立 


Ca" =C(a’)=0 





根据 以 上 公式 进行 频 域 编码 。 


设 M=[Mk-1Mk-2.….M1Moj 为 信息 矢量 ， 在 Mo 和 M1 之 间 插入 2t 个 “0”， 得 到 另 一 个 矢量 C1， 


C =[M,, M', Rp M ():…: 0 Mi 


把 Ci 看 作 频 域 码 和 撩 ， 对 其 进行 傅 里 叶 反 变换 就 可 以 得 到 时 域 码 矢 C。 
下 面 以 RS (7，3) 码 为 例 来 说 明 RS 码 的 时 域 编码 过 程 。 
RS (7，3) 码 的 符号 取 自 有 限 域 GF (23) 上 ，GF (23) 的 元 素 如 表 7-5 所 示 。 


表 7-5 GF (2”) 上 的 元 素 


rm 
a =1 010 2 
0 100 4 
0 =a+l 011 3 
0’=0 +a LO 6 
0 =1+ato 111 7 
oo=1+o- 101 > 
a'=1 001 ] 


由 表 7-5 可 知 ，GF (23) 的 本 原 多 项 式 p (x) 为 
3 
p(x)=x’ 二 X 十 ] 


设 待 编码 的 信息 码 组 M=[1c40]， 即 M (x) =x2+a4x。 则 xmkM (x) =x4 (x2+a4x) =x6+a4x3, 


用 xn-kM (x) 除 以 g (x) ， 求 得 r (x) 为 


r(x)=x" M(x)mod(e(x)=(x+ax mod(x +x+1)=a x +a x +x 
因此 ， 编 成 的 RS (7，3) 码 为 C=[1 a40 oa? o? 1 0]。 


3.RS 译 码 算法 


RS 码 的 译 码 算 法 是 从 BCH 码 的 译 码 算 法 演变 而 来 的 。 与 编码 算法 相 比 ， 译 码 算法 比较 复杂 ， 需 要 的 运算 量 也 比较 大 。 其 中 ， 比 较 有 代表 性 的 算法 是 
Berlekamp-Messay 算 法 (简称 BM 算法 ) 和 Euclid 算 法 。 在 这 两 种 算法 的 基础 上 ， 后 来 又 派生 出 了 一 些 修正 算法 或 快速 算法 。 


Rs 码 的 译 码 可 以 按照 下 面 步骤 进行 : 

1) 由 接收 多 项 式 R (x) 计算 伴随 式 S) U=1，2，…，2t) 。 

2) 利用 BM 算法 或 Euclid 算 法 ， 由 Sj 求 出 错误 位 置 多 项 式 0 (x) 。 
3) 利用 Chien 搜 索 法 求 0 (x) 的 根 ， 其 倒数 为 错误 位 置 数 。 

4) 计算 错误 值 。 

5) 接收 多 项 式 减 去 错误 多 项 式 ， 完 成 纠 错 。 


假定 发 送 码 字 C (x) 为 
天 一 ] 用 一 了 | 
C(X)=C,_ x +C, xX ++CX+Oo 
接收 码 字 R (x) 为 


RO)=R, pe +R, a" + +Rix+Ro 


“下 一 


1 一 1] 太一 之 
以 LW)=Ew-x + 上 ,xx +…+ 上 1Xt+ 上 0 表示 含有 e (e <t) 个 错误 的 错误 图 样 ， 则 有 


R(xX)=C(x)+E(X) 


E(x)=Y, X+Y, X,+**+Y 


一 


+X 


已 
其 中 Xx 是 第 个 错误 的 位 置 ， 并 定义 Xi=o;，Y 滥 其 错误 值 。 
第 一 步 ， 计 算 伴随 式 S; (j=1，2，.…，2t) 。 
把 oj (j=1，2，.…，2t) 代入 多 项 式 R (x) ， 得 
_p/ 六 一 六 ,nl1 六 月 一 人 加 i 
S) A(C ) A (0 ) +h,_,(0 ) 十 十 作 1C +R, 


一 
如 果 Sj=0， 则 认为 接收 无 误 ; 如 果 Sjz0， 则 由 S 蓝 出 错误 图 样 。 


因为 


R(o)=C(ow)+E(ocD)= 忆 (oO) 


S=R(0)=E(0)=E, 1 (0)” +E, A(0) + 和 +h +Eo 


S =YX +YX,+..……+YX, 

Sa) Th -Gy 

S$, = YO + OC) tt YX) 
方程 组 用 答 阵 表示 如 下 : 


或 者 简写 为 XY=5S 


其 中 ， 


从 本 质 上 说 ， 译 码 的 目的 就 是 求解 有 限 域 GF (2™"m) 上 的 这 组 伴随 式 联 立 方程 组 。 
第 二 步 ， 用 BM 和 迭代 算法 ， 由 9j 确 定 错误 位 置 多 项 式 G (x) 。 


直接 求解 方程 组 非常 困难 ， 一 般 采 用 间接 方法 求解 。 由 伴随 式 S 找 出 错误 图 样 E (x) 时 ， 可 先 确定 错误 位 置 Xi， 再 求 错误 值 Yi。 如 果 将 它 转换 成 线性 方程 


组 ， 用 错误 位 置 多 项 式 来 求解 ， 则 将 使 求解 变 得 可 行 。 为 此 ， 按 照 码 的 纠 错 能 力 定义 错误 位 置 多 项 式 0 (x) 为 : 


o(x)=|[Q -xX,)=1+ox+.…+o,x’ 


t=] 


Em ; ssX=Y1l 见 "1-0, ep di Es 
若是 第 | 个 错误 位 XY ， 则 %X )=0。 因此 ， 求 错误 位 置 就 是 求解 错误 位 置 多 项 式 0。 (x) 的 根 。 


把 o (x) 展开 ， 得 到 


o(x)=T [0—xX,)=1-(X,+X,+.+X)x+ (XX, + XX + + ,XX + + (DX X,Y x 
i=}l 


Oo, = 一 》 蕊 
i=] 
0, =—》 X,Y 
[< 一 ] 
0.=(-1) XX,X*…X, 
则 


5( 丰 )=1+o% +***toA, ,i=1,2,°°,t 
Xo(X, )=X+o NX, +*…+0,=0,i=1,2,:…,t 
两 边 乘 以 YX ,得 
rit itty-1 Fr VN ;一 Wy 
yA TOA FO A Ul | Zt 
将 上 式 对 i=1，2，...，t 求 和 ， 得 


RE i es 


将 上 式 展 开 ， 得 


9 | 十 辐 必 ,十 … 十 GD =0 


9 十 加 由 i ++od,=0 


加 二 lo eh my 

用 和 矩阵 形式 表示 为 : 
S SS, Sl|o, ¢ 
:A Ny A, O, S 


2 1 +2 


或 简写 为 Mo=S， 其 中 


十] 
M = Da 9 了 ,0 = “2 ,5 = Dr 
SS oO, Dy, 


该 方程 组 由 t 个 未 知 数 和 t 个 方程 组 成 ， 可 以 采用 BM 算 法 或 者 Euclid 算 法 通过 迭代 来 进行 求解 。 


Euclid 算 法 与 BM 算 法 的 主要 区 别 在 于 和 代 过 程 。BM 人 夫 代 是 基于 目 回 归 滤 汶 器 综合 原理 来 求解 最 短 反馈 连接 多 项 式 C_ (x) 的 过 程 ; Euclid 迭 代 是 基于 多 项 
式 分 解 原理 来 求解 两 个 多 项 式 最 大 公 因 式 的 过 程 。 下 面 只 介绍 BM 迭 代 算 法 的 求解 过 程 。 


BM 适 代 算法 是 由 初 值 经 过 2t 次 和 迭代， 最 后 求 得 错误 位 置 多 项 式 0 (x) 的 一 种 递 推 方法 。 在 运 代 的 过 程 中 ， 假 定 第 i 次 欠 代 得 到 的 错误 位 置 多 项 式 用 


0 () =1+01 0 x+...+of 人 xi 表示 ， 其 中 | 为 c1  x 的 次 数 。 另 外 ， 设 di 为 一 个 偏 量 。 
通常 ， 把 迭代 的 初始 值 设 为 


i=—l,o" (x)=1,d, =17 =0 


] 
=0o (elds =0 


i 避 经 守 雍 第 i 加 淡 仆 ET] Treo Ot 
假设 已 经 完成 第 i 次 迭代 ， 求 得 I i 


小 。 


i (i) 
则 迁 代 过 程 为 : 首先 计算 Qir1IToi01 十 … 十 ir1-1101” ,然后 进行 第 i+1 次 迭代 


ot ' (x) 到 w(x) 
be 一 
0 (=a (x)-dd, aa (xz) 


[ 


[十 ] 


= max(l,i— J,/;,) 


其 中 ，j 是 第 i 次 迭代 之 前 的 某 次 迭代 次 数 ， 它 满足 dj*z0， 且 j-l; 为 最 大 值 。 


当 第 2t 次 迭代 完成 时 ， 所 得 的 c (< (x) 就 是 错误 位 置 多 项 式 0 (x) 。 如 果 o (x) >t， 则 接收 码 字 中 含有 t 个 以 上 的 错误 ， 一 般 不 可 能 找 出 其 错误 位 


第 三 步 ， 用 Chien 搜 索 法 寻找 错误 的 位 置 。 


第 四 步 ， 计 算 错误 值 。 


得 到 错误 位 置 后 ， 代 入 伴随 式 联 立 方程 求解 错误 值 ， 束 变 为 了 求解 线性 方程 组 XY=S。 直 接 求 解 它 计 算 量 很 大 ;可 以 及 用 以 下 方法 来 间接 求解 ， 


当 实 际 产生 的 错误 个 数 为 e<t 时 ， 


o(xX) = [Ta — XX,)= Vox',o, = ] 
i=0 i=0 


e—l 
nb = 
i=0 
e 一 ] 


at)=aiO)U-x)=(-x)》 ai 


1= 必 


e—] e 一 ] e—] e—] 
/ | ; ; / i = z i 一 i+] 
i=00 i=0 i=00 i=0 


计算 量 较 


比较 两 边 的 系数 可 得 


oo =060=] 
CO 一 Ci CT 2 e 一 ] 
Oi=0, a 1.2……,e 一 ] 


四 | ” e—i 
> oy RR) 
1 一心 1 一心 上 三 ] 
交换 求 和 顺序 


el e el e 
2 O jd = YX 5 ep ba 和 从， CT (CE ) 


k=] 


由 于 人 XK ) 仅 当 k= 则 不 为 夫 ， 故 
去 E 一 | 
OS = 也 Na )=Y 0X 
i=00 = 
由 此 可 得 


We—] 
i=0 “万 De 一 i 


J pe—1 已 一 1 
i-0 Ot X) 


最 后 一 步 ， 纠 正 错误 。 


将 所 得 错误 值 加 到 相应 的 错误 位 置 上 ， 计 算 太 送 码 元 矢量 C (Xx) 


C(x) = R(x)— E(x) 


下 面 ， 以 RS (7，3) 为 例 ， 说 明 RS 码 的 译 码 过 程 。 
假定 接收 矢量 为 R=[0 0 a 0 a3 0 01， 即 R_(x) =oax4+o3x<。 


第 一步 计算 HWE 0-1 2，3， 全， 计算 和 AD 下 
9 =R(w)=o +w =0 
9 =Ra )=w +w =w 
S,=R(a )=w +w =] 


9 =R(a )=a + =Cr 


第 二 步 ， 为 求 错 误 位 置 多 项 式 0 (x) ， 列 表 如 表 7-6 所 示 。 


0 


表 7-6 求解 错误 位 置 多 项 式 0 (x) 的 迭代 过 程 表 


j 广 / 
= | 
0 0 
] ] 
2 0 
3 1 
4 





所 以 ， 可 得 Ga (x) =aex<+Qx+1。 


第 三 步 ， 把 ol (ij=0，1，2，.…，6) 代入 o (x) ， 可 以 发 现 %? 和 o3 是 c (x) 的 根 ， 而 这 两 个 根 的 逆 分 别 是 xc 和 co4。 因 此 ， 错 误 位 置 在 2 和 4。 


第 四 步 ， 求 解 错误 值 ， 如 下 : 


X=0° ,=a 
0jo=00=1 
goo-1,2 
O01l =01-010X=0+0 =0 


| 4 .2 
O01=01-0) 04 二 QT 二 CQ =0 


yy _ | _ ax +0 i 
XX+o0) (a +o’) 
| Qa" +0 


by 


Al CQ (0 +0) 


因此 ,错误 图 样 为 


E(x)=ax +o x 


C(x) = R(X) -E(x)=(axt +ox)+(Qx +ax)=0 


即 恢 复 后 的 信息 码 元 为 [0000000]， 译 码 完成 。 


7.2 平衡 机 制 


7.2.1 概述 


随 着 闪存 内 数据 的 不 断 更 新 和 改写 ， 闪 存 中 无 效 的 过 时 数据 也 会 随 之 增多 ， 而 内 存 内 部 的 可 用 物理 存储 空间 逐渐 减 小 。 因 此 ， 需 要 相应 的 垃圾 回收 
(garbage collection) 机 制 ， 负 责 定 期 将 过 时 数据 所 占用 的 空间 释放 ， 保 障 闪 存 内 部 空间 的 持续 重复 性 利用 。 


由 于 NAND Flash 写 入 数据 时 ， 首 先 要 进行 块 擦 除 操作 ， 而 存储 块 的 擦 除 次 数 有 限 。 在 其 存储 数据 时 ， 和 存储 块 的 选择 是 顺序 的 ， 而 闪存 中 数据 的 更 新 是 随 
机 的 ， 这 将 导致 存储 块 擦 除 次 数 不 能 均匀 分 布 ， 从 而 影响 其 使 用 寿命 。 因 此 需要 及 用 损耗 均衡 技术 ， 即 通过 特定 的 算法 实现 对 存储 块 的 使 用 均衡 操作 。 损 耗 均 
稀 策 略 即 通过 分 配 已 擦 除 次 数 较 少 的 块 来 做 数据 更 新 ， 将 磨损 平均 地 分 散 到 整个 NAND Flash 的 存储 空间 ， 以 延长 NAND Flash 的 使 用 寿命 。 


固态 存储 器 件 的 主 控制 器 可 以 提供 这 两 方面 功能 ， 即 垃圾 回收 和 使 用 均衡 ， 下 面 分 别 介 绍 其 实现 原理 和 机 制 。 


7.2.2 ”垃圾 回收 


垃圾 回收 〈GC) 束 是 把 一 个 闪存 块 里 的 有 效 页 数据 复制 到 一 个 空 闪 块 里 ， 然 后 把 这 个 块 完全 擦 除 。 


在 内 存 读 写 过 程 中 ， 一 个 新 的 空 闪 块 被 分 配 出 来 ， 骨 把 原 块 里 所 有 有 效 的 数据 和 新 写 入 的 数据 一 起 复制 到 新 块 ， 旧 块 被 擦 除 ， 擦 除 后 的 旧 块 被 重新 放 到 空 
亲 块 备用 区 等 待 下 次 的 分 配 写 入 ， 这 样 内 存 空间 束 可 以 循环 使 用 了 。 


由 于 闪存 的 读 写 特性 ， 数 据 不 能 像 在 传统 的 机 械 硬 盘 (HDD) 里 那样 被 直接 履 盖 重 写 ， 而 是 将 更 新 的 数据 写 入 新 的 空闲 页 ， 并 更 新 映射 表 ， 如 图 7-4 所 
示 。 对 于 一 个 新 闪存 Block， 当 数据 第 一 次 写 入 的 时 候 ， 由 于 所 有 的 颗粒 都 为 已 擦 除 状 态 ， 所 以 数据 能 直接 写 入 。 但 如 果 闪 存 上 原来 就 有 数据 ， 那 么 写 入 操作 
就 不 一 样 了 ， 主 控 会 把 新 数据 写 在 空闲 闪存 空间 ， 然 后 把 逻辑 地 址 指向 这 个 新 的 物理 地 址 ， 而 旧 的 地 址 内 容 就 变 成 了 无 效 数 据 ， 但 是 以 后 要 在 上 面 再 次 写 入 的 
话 ， 就 需要 首先 擦 除 这 个 无 效 数据 ， 这 是 由 闪存 erase-before-write ( 写 前 擦 除 特性 ) 决定 的 。 





图 7-4 内 存 数据 写 入 


垃圾 回收 机 制 的 实现 主要 需要 考虑 以 下 三 个 方面 的 问题 。 


1. 垃 圾 回收 时 机 的 选择 


闪存 数据 的 垃圾 回收 时 机 可 以 是 周期 性 执行 ， 或 者 通过 设 定 靖 值 来 触 友 垃圾 回收 机 制 ， 大 致 有 三 种 策略 : 


1) 被 动 垃 圾 回收 。 即 当 闪 存 中 空闲 块 的 数量 低 于 某 个 辣 值 时 触 友 垃圾 回收 机 制 。 


2) 定期 执行 垃圾 回收 。 即 达到 固定 的 时 间 立 值 时 ， 人 全盘 扫 摘 内 存 ， 将 其 中 的 有 效 页 合并 整理 到 一 个 包含 全 部 有 效 页 的 块 ， 而 那些 无 效 的 页 和 块 都 将 被 擦 


3) 闲置 垃圾 回收 。 即 在 闪存 空 闲 的 时 候 提前 进行 垃圾 回收 ,释放 空间 ， 保 证 一 定数 量 的 空 闪 块 以 便 后 面 的 写 入 操作 可 以 顺利 进行 。 
目前 主要 使 用 被 动 垃 圾 回收 ， 这 是 由 于 其 判断 条 件 简单 而 且 性 能 损失 较 小 ， 边 写 入 边 进行 垃圾 回收 ,不 会 增加 多 余 的 写 入 放大 。 


2. 坪 圾 回收 的 方式 


由 于 闪存 转换 层 (FTL) 使 用 的 地 址 映射 策略 不 同 ， 脏 数据 ( 即 无 效 数 据 ) 的 分 布 可 能 是 无 规律 的 ， 因 此 垃圾 回收 的 方式 也 是 多 种 多 样 的， 垃圾 回收 方式 
的 不 同 将 直接 影响 系统 的 性 能 。 当 更 新 块 被 用 完 ， 需 要 进行 碎片 回收 时 ， 主 要 有 三 种 策略 ， 即 全 合并 (Full Merge) 、 部 分 合并 (Partial Merge) ， 以 及 转 


换 合并 (Switch Merge) 三 种 方式 。 如 图 7-5 所 示 ，| 表 示 无 效 数 据 (Invalid Data) ，V 表 示 有 效 数 据 (Valid Data) 。 


数据 块 A 擦 除 块 C 日 志 块 B 
DATA OOB DATA OOB 
[LPN-07 

”|LPN=71,I 


DATA OOB DATA OOB DATA OOB 
LPNE3.V 


b) 部 分 合并 操作 c) 转换 合并 操作 





图 7-5 ”垃圾 回收 的 三 种 方式 


全 合并 操作 : 首先 分 配 一 个 空 闪 块 ， 把 上 日 数据 块 和 更 新 块 中 的 有 效 数据 页 写 入 新 空 闪 块 中 ， 把 写 入 新 数据 的 块 置 为 有 效 数据 块 ， 并 把 旧 的 数据 块 和 日 志 块 


全 部 探 除 ， 如 图 7-5a 所 示 。 全 合并 操作 一 次 过 程 需 要 多 个 读 写 操作 和 两 次 探 除 操作 ， 性 能 开销 较 大 。 


部 分 合并 操作 : 假如 数据 块 中 的 有 效 数据 页 的 数量 允许 全 部 复制 到 更 新 块 的 空余 页 ， 则 在 数据 复制 后 ， 把 要 更 新 块 置 为 数据 块 ， 再 把 旧 的 数据 块 探 除 ， 如 


图 7-5b 所 示 。 与 全 合并 操作 相 比 ， 部 分 合并 操作 减少 了 一 次 探 除 操作 。 


转换 合并 操作 : 假如 数据 块 的 所 有 数据 页 都 被 顺序 重 写 ， 则 只 要 把 更 新 块 置 为 数据 块 ， 再 探 除 无 效 的 数据 块 即 可 ， 如 图 7-5c 所 示 。 转 换 合 并 操作 的 开销 最 


小 。 


3. 坪 圾 回收 块 的 选择 策略 


一 般 垃 圾 回收 的 过 程 是 选取 无 效 数 据 较 多 的 块 进行 回收 ， 这 样 可 以 减少 有 效 数据 的 写 入 ， 同 时 还 能 减少 块 被 擦 除 的 次 数 ， 起 到 延长 存储 器 寿命 的 作用 .。 
此 ,很 多 垃圾 回收 是 按 系 统 中 各 块 含有 有 效 数据 页 的 多 少将 数据 块 划分 等 级 的 ， 无 效 数据 越 多 则 块 的 等 级 越 高 。 在 回收 的 时 候 优 先 回 收 等 级 较 高 的 块 ， 这 样 可 


以 得 到 较 高 的 垃圾 回收 效率 ， 从 而 提高 盘 片 性 能 。 


7.2.3 ”使 用 均衡 


Flash 心 片 是 由 多 个 存储 单元 (Cell) 构成 ， 每 个 Cell 表 示 1 位 或 多 位 ， 数 据 写 入 是 一 个 向 Cell 中 注入 电 和 葵 的 过 程 ， 而 擦 除 操作 是 一 个 释放 Cell 中 电 奏 的 过 
程 ， 由 于 每 一 次 充电 放电 都 会 对 Cell 造 成 一 定 程度 的 损伤 ， 而 其 相应 充 放电 和 奏 的 次 数 是 有 限 的 ， 因 此 ， 寿 命 问 题 是 Flash 存 储 器 的 一 个 不 可 忽视 的 问题 。 


目前 在 设计 以 NAND Flash 作 为 存储 介质 的 固态 存储 器 件 时 ， 都 会 考虑 一 个 很 重要 的 问题 ， 那 束 是 损耗 均衡 策略 。 假 设 系统 中 共有 100 个 块 ， 其 中 数据 块 
有 80 个 ， 另 外 20 个 块 作为 替换 块 ， 因 此 对 用 户 来 说 ， 和 存储 器 只 有 80 个 块 ， 如 果 系统 中 可 用 的 块 少 于 80 个 ， 则 此 存储 器 就 已 经 达到 使 用 寿命 。 如 果 每 个 块 的 擦 
除 寿命 是 一 万 次 ， 并 且 其 中 21 个 块 由 于 过 于 频繁 地 使 用 而 过 早 达 到 擦 写 次 数 上 限 ， 即 一 万 次 ， 那 么 这 21 个 块 束 会 被 标记 为 无 效 块 而 禁止 被 使 用 ， 而 此 时 即便 另 
外 79 个 块 才刚 刚 被 擦 写 一 次 ， 系 统 也 仍然 达到 了 使 用 寿命 。 如 果 和 存储 器 件 设 计 了 一 个 好 的 均 稀 策略， 使 系统 中 100 个 块 同时 达到 使 用 寿命 ， 则 整个 存储 器 系统 
的 寿命 达到 最 长 ， 因 此 一 个 好 的 均衡 策 略 直 接 影响 到 存储 器 的 使 用 寿命 。 


使 用 均衡 〈 又 称 为 损耗 均衡 ) 是 为 了 均匀 地 将 写 命 令 下 发 至 存储 介质 的 每 一 个 块 从 而 达到 延长 整个 存储 器 使 用 寿命 的 一 种 管理 策略 ， 损 耗 均衡 策略 分 为 静 
态 损耗 均衡 策略 与 动态 损耗 均衡 策略 两 种 。 其 中 动态 损耗 均衡 策略 是 在 向 NAND Flash 上 写 的 过 程 中 ， 将 经 常 交 换 的 热 数 据 分 配 至 不 同 的 块 达到 擦 写 次 数 平均 
的 效果 ， 静 态 损耗 均衡 全 略 是 将 长 期 存放 静态 数据 、 不 修改 或 很 少 修改 的 区 域 进行 强制 搬移 的 过 程 。 


对 于 Wear-Leveling 算 法 ， 固 态 仓储 器 中 的 块 单元 主要 有 两 种 类 型 : 即 空 闪 块 与 数据 块 。 数 据 块 是 存储 器 的 主要 存储 部 分 ， 并 且 受 到 数据 存储 器 和 Wear- 
Leveling 算 法 的 影响 。 空 闪 块 的 数量 在 整个 存储 系统 中 约 占 20% (假如 一 个 系统 有 128GB 的 物理 存储 空间 ， 数 据 块 占 100GB， 空 闪 块 占 28GB 左 右 ) ， 主 要 用 
于 缓冲 损耗 均衡 算法 和 隐藏 NAND Flash 的 erase-before-write 特 性 。 这 样 束 意味 着 固态 存储 器 中 的 块 会 根据 相应 的 损耗 均衡 策略 在 空 闪 块 池 与 数据 块 池 之 间 
相互 转换 。 


1 动态 损 耗 均衡 策略 


随 着 FG 充 放电 次 数 的 增多 ， 二 氧化 硅 绝 缘 层 的 绝缘 能 力 将 遭 到 损 厅 ， 最 后 失去 绝缘 性 ， 无 法 保证 FG 中 保存 有 足够 的 电 谷 。 此 时 ， 这 个 Cell 束 被 宣判 为 损 
坏 ， 即 Wear Off。 系 统 如 何 判 断 出 某 个 Cell 已 经 不 能 保存 数据 呢 ? 在 写 操作 中 会 向 Cell 中 充电 ， 成 功 后 会 在 对 应 的 位 线 中 体现 出 Cell 当 前 的 电势 ， 可 通过 检查 
这 个 电势 表示 的 位 是 否 与 待 写 入 数据 中 对 应 的 位 一 致 来 判断 ， 一 致 则 判断 为 完好 ， 不 一 致 则 损坏 。 如 果 遇 到 写 入 数据 位 为 1 的 情况 ， 那 么 写 入 过 程 中 对 这 个 
Cell 不 会 有 任何 动作 。 如 果 这 个 Cell 已 经 损坏 ， 即 不 能 被 充电 或 者 充电 量 太 低 以 至 于 不 能 感应 出 足够 的 电势 ， 那 么 当 数 据 被 写 入 之 后 ， 依 然 被 判断 为 完好 。 这 
虽然 与 实际 不 符 ， 但 是 不 影响 使 用 ,一旦 这 个 实际 已 损坏 的 Cell 在 下 次 被 更 改 为 0， 束 会 被 判断 出 已 损坏 。 


损坏 的 Cell 将 拖累 这 个 Cell 所 在 的 整个 页 (Page) 被 标记 为 损坏 ， 因 为 闪存 寻 址 和 MO 的 最 小 单位 为 页 (Page) 。 损 坏 的 页 (Page) 对 应 的 逻辑 地 址 将 被 
重 定向 映射 到 其 他 完好 的 预 留 页 (Page) ， 系统 将 这 些 重 定向 表 保 存在 ROM 中 ， 每 次 加 电 均 被 载 入 RAM 以 供 随时 查询 。 


MLC 由 于 器 件 复杂 ， 其 可 擦 写 的 寿命 比较 短 ， 小 于 10000 次 。 而 SLC 则 长 一 些 ， 十 们 于 MLC， 即 小 于 100000 次 。 这 个 值 是 很 惊人 的 ， 对 于 在 某 些 场合 
下 ， 有 可 能 一 天 束 可 以 废 掉 一 大 堆 Cell/Page， 几 个 月 之 内 当 预 留 的 Page 都 被 耗 尽 后 ， 焉 会 废 掉 整 个 存储 器 。 这 是 绝对 不 能 接受 的 。 


为 了 避免 同一 个 Cell 被 高 频率 擦 写 ， 有 一 个 办 法 : 每 次 针对 某 个 或 者 某 段 LBA 的 写 操作 都 写 到 闪存 中 的 Free Space 中 ， 即 上 一 次 全 盘 控 除 之 后 从 未 被 写 过 
的 块 /页 中 ， 这 些 Free Space 已 经 被 放电 ， 直 接 写 入 即 可 ， 无 须 再 做 Copy On Write 操作 了 。 如 果 再 次 遇 到 针对 这 个 或 者 这 段 LBA 的 写 操 作 ， 那 么 系统 会 再 次 
将 待 写 入 的 数据 重 定向 写 到 Free Space 中 ， 而 将 之 前 这 个 逻辑 地 址 占用 的 页 标记 为 “Garbage”， 可 以 回收 再 利用 。 等 到 块 中 一 定 比例 (大 部 分 ) 的 页 都 被 标 
记 为 “Garbage” 时 ， 并 且 存 在 大 批 满足 条 件 的 块 时 ， 系 统 会 批量 回收 这 些 块 ， 即 执行 Copy On Write 过 程 ， 将 尚未 被 标记 为 “Garbage ”的 页 复制 到 RAM 
Buffer， 将 所 有 页 汇集 到 一 起 ， 然 后 写 入 一 个 新 擦 除 的 块 ， 再 将 所 有 待 回收 的 块 进行 擦 除 操作 ， 变 成 Free Space。 这 样 做 就 是 为 了 将 写 操作 平衡 到 所 有 可 能 的 
块 中 ， 降 低 单位 时 间 内 每 个 块 的 擦 写 次 数 ， 从 而 延长 Cell 的 寿命 。 

动态 均衡 是 影响 闪存 寿命 的 非常 天 键 的 技术 ， 尽 管 各 个 厂商 的 实现 方式 不 同 ， 但 都 是 通过 在 分 配 替 换 块 时 首先 选取 擦 除 次 数 较 少 的 块 进行 分 配 ， 将 写 入 数 
据 最 大 程度 均衡 地 分 配 到 每 个 存储 单元 上 ， 在 使 用 频 度 上 保障 不 会 集中 使 用 部 分 块 ， 尽 可 能 让 所 有 存储 单元 的 写 入 次 数 均衡 ， 以 防止 某 个 存储 单元 被 过 度 擦 
写 ， 导 致 盘 片 失效 。 


该 算法 之 所 以 称 为 动态 的 ， 是 因为 它 的 每 次 操作 都 首先 在 缓冲 区 中 处 理 数据 ， 然 后 再 写 入 闪存 中 。 


当 系 统 在 下 友 一 个 写 请 求 的 时 候 ， 动 态 均 衡 策略 即 被 局 动 。 首 先 对 擦 除 次 数 计数 表 (ECT) 的 空间 块 区 进行 浏览 ， 寻 找 被 擦 除 次 数 最 小 的 块 。 如 果 找到 符 
合 要 求 的 物理 块 ， 融 将 该 块 作为 蔡 换 块 ， 将 数据 写 向 该 块 ， 同 时 更 新 映射 表 ， 即 将 蔡 换 块 中 数据 被 写 入 的 物理 地 址 与 主机 下 友 的 逻辑 地 址 在 转换 映射 表 中 建立 
彼此 相应 的 映射 天 系 ， 逻 辑 地 址 所 指向 的 原 物 理 地 址 被 标记 为 无 效 。 


如 此 ， 即 使 重复 不 断 地 对 同一 个 逻辑 地 址 进行 数据 更 新 ， 由 于 物理 地 址 与 逻辑 地 址 之 间 的 映射 关系 也 在 相应 地 友 生 变化 ， 因 此 数据 就 不 会 始终 在 同一 个 物 
理 块 上 重复 写 入 。 在 系统 空 闪 或 空 闪 块 区 中 空 闪 块 数量 不 足 时 ， 丈 需要 将 系统 中 无 效 数据 最 多 的 块 进行 回 收 ， 放 入 空闲 块 区 中 以 供 下 一 次 使 用 。 


由 于 在 写 入 数据 时 ， 动 态 损耗 均衡 算法 一 般 是 找 出 擦 写 次 数 较 少 的 存储 单元 ， 表 把 数据 写 入 其 中 ， 从 而 达到 均衡 效果 ， 因 此 动态 损耗 均衡 算法 主要 应 用 于 
空 用 存储 块 区 。 如 图 7-6 即 是 使 用 动态 损耗 均衡 算法 前 后 的 对 比 示意 图 。 
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图 7-6 动态 策略 效果 图 


由 图 7-6 可 以 看 出 ， 和 存储 器 在 未 来 用 动态 损耗 均衡 算法 时 ， 部 分 块 因 过 度 频繁 被 使 用 而 磨损 严重 ， 这 部 分 块 会 很 快 达到 使 用 寿命 而 被 禁止 使 用 ， 而 另 一 部 
分 块 却 几 乎 未 被 使 用 ， 这 样 便 会 因为 各 块 使 用 不 均衡 而 缩短 了 存储 器 的 使 用 寿命 。 当 存储 器 采用 了 动态 损耗 均衡 算法 后 ， 系 统 中 各 块 的 使 用 情况 大 致 趋 于 平 
均 ， 几 乎 没有 出 现 部 分 块 过 度 频繁 被 使 用 的 情况 ， 从 而 有 效 地 延长 了 存储 器 的 使 用 寿命 ， 达 到 了 较 好 的 均衡 效果 。 但 是 ， 由 于 某 些 块 上 面 存储 的 数据 一 直 很 少 
被 更 新 (如 系统 文件 等 ) ， 这 样 的 块 始 终 示 被 再 次 使 用 ， 而 动态 损耗 均衡 每 次 都 是 通过 垃圾 回收 或 系统 下 友 数 据 更 新 命令 时 被 局 动 ， 换 句 话 说 ， 只 能 对 有 数据 
更 新 的 块 才能 发 挥 其 作用 ， 对 于 这 样 的 块 也 无 能 为 力 ， 这 种 情况 也 造成 了 各 块 的 使 用 情况 不 均衡 现象 ， 因此， 研究 者 们 提出 了 静态 损耗 均衡 策略 。 


2. 静 态 损耗 均衡 策略 


由 于 动态 损耗 均衡 算 法 并 没有 考虑 很 少 修改 的 有 效 数据 存储 单元 ， 这 束 导 致 这 些 存 储 单元 的 擦 写 次 数 远 远 少 于 其 他 存储 单元 ， 从 而 影响 到 均衡 程度 。 为 避 
免 这 种 问题 的 出 现 ， 固 态 存 储 器 引入 了 静 态 损耗 均衡 机 制 。 静 态 损 耗 均衡 机 制 先 识 别 出 长 期 未 经 修改 的 有 效 数据 存储 单元 ， 将 其 中 的 数据 转移 至 其 他 空闲 人 存 储 
单元 ， 回 收 代 用 ， 并 纳入 动态 均衡 的 查找 范围 ， 从 而 避免 了 动态 均衡 市 来 的 问题 。 


静态 损耗 均衡 与 动态 损耗 均衡 策略 的 最 大 区 别 束 是 一 个 是 主动 ， 一 个 是 航 动 。 动 态 损耗 均衡 是 在 数据 更 新 时 航 局 动 的 ， 其 数据 更 新 一 般 是 由 垃圾 回收 或 主 
机 下 发 写 数据 命令 时 产生 ， 不 是 为 了 均衡 而 启动 均衡 策略 ;而 静态 损耗 均衡 策略 是 系统 为 了 均衡 而 局 动 的 ， 与 数据 更 新 操作 无 天 ， 是 被 动 的 。 


为 避免 对 性 能 造成 大 的 影响 ， 静 态 损耗 均衡 一 般 采 用 周期 性 搬移 数据 的 方法 。 对 NAND Flash 接 收 的 数据 总 量 进行 统计 ， 设 定 阅 值 Threshold， 当 写 入 总 
量 达到 阅 值 Threshold 时 按照 物理 块 顺序 与 空 闪 块 进行 数据 搬移 。 


一 般 来 说 ， 和 存储 器 要 想 达 到 较 好 的 均衡 效果 ， 必 须 使 用 静态 损耗 均衡 与 动态 损耗 均衡 相 结 合 的 策略 ， 动 态 损耗 均衡 主要 是 针对 数据 更 新 (垃圾 回收 或 主机 
下 发 写 数 据 命 令 ) 时 选择 适当 的 替换 块 ， 而 静态 损耗 均衡 是 为 了 将 系统 中 长 期 不 更 新 的 块 中 的 数据 进行 强制 搬移 ， 以 释放 出 该 块 并 以 备 下 一 次 使 用 ， 两 种 策略 
职能 不 同 ， 方 法 不 同 ， 但 最 终 目的 却 是 一 致 的 。 


如 图 7-7 所 示 ， 动 静态 结合 的 损耗 均衡 可 以 有 效 地 提高 存储 器 磨损 均衡 效果 。 
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图 7-7 动静 态 策略 结合 效果 图 


从 图 7-7 可 以 看 出 ， 在 使 用 了 动态 均衡 与 静态 均衡 相 结 合 的 策略 后 ， 系 统 中 各 块 的 擦 除 情况 大 致 趋 于 平均 ， 达 到 了 很 好 的 均衡 效果 。 


7.3” 坏 块 管理 
7.3.1 概述 


坏 块 又 称 为 无 效 块 (Invalid Block) ， 是 捐 一 个 块 中 的 一 位 或 多 位 不 能 正常 翻转 ， 如 果 对 坏 块 进行 操作 ， 可 能 会 造成 数据 的 丢失 或 错误 ， 从 而 可 靠 性 得 不 
到 保证 。 由 于 目前 的 技术 水 平 限制 ，NAND Flash 本 身 存 在 固有 坏 块 ， 即 出 三 时 就 存在 的 初始 坏 块 ， 在 数据 重 写 过 程 中 也 会 产生 坏 块 ， 如 果 不 对 这 些 坏 块 进行 
管理 ， 文 件 一 旦 存储 到 坏 块 上 ， 融 很 难保 证 数据 的 完整 性 。 考 虑 到 要 保证 存储 数据 的 完整 性 和 正确 性 ， 需 要 采取 坏 块 管理 技术 来 实现 对 固有 坏 块 和 新 产生 坏 块 
的 有 效 管理 ， 即 在 NAND Flash 的 应 用 中 实现 可 靠 的 坏 块 管 理 技术 ， 准 确 识别 出 坏 块 并 且 在 进行 读 、 写 、 探 除 操作 时 将 坏 块 屏蔽 。 


NAND Flash 的 坏 块 管理 技术 可 以 基于 坏 块 表 进 行 。 诈 先 建立 一 张 坏 块 表 ， 并 按 顺 序 依 次 记录 所 有 块 是 否 为 坏 块 的 标记 值 ， 坏 块 表 在 执行 完 坏 块 检 测 操作 
之 后 更 新 。 当 读 写 数据 时 ， 先 读 取 坏 块 表 中 相应 地 址 处 的 块 标记 值 ， 以 判断 当前 块 是 否 为 坏 块 。 如 果 是 坏 块 ， 则 需要 采取 一 定 的 策略 将 当前 操作 重新 映射 到 一 
个 新 的 地 址 ， 以 保证 所 用 到 的 地 址 空间 中 不 包含 坏 块 。 


7.3.2” 坏 块 管理 的 实现 


NAND Flash 的 坏 块 管理 主要 包括 : 坏 块 表 的 建立 、 更 新 和 坏 块 的 屏 贡 。 下 面 分 别 介绍 其 具体 实现 过 程 。 


1. 建 立 坏 块 表 


NAND Flash 出 三 的 时 候 束 包含 有 一 定数 量 的 初始 坏 块 ， 在 出 厂 之 前 厂家 会 对 其 做 一 定 的 标记 ， 标 为 坏 块 。 初 次 使 用 NAND Flash 时 ， 要 先 读 取 坏 块 信 
息 ， 否 则 擦 除 操作 会 将 初始 化 坏 块 标记 清空 。 一 般 的 厂商 如 东芝 、SanDisk、 三 星 、 镁 光 等 都 会 在 NAND Flash 出 三 前 做 坏 块 检测 和 人 处理 ， 对 初始 坏 块 做 一 定 
的 标记 ， 方 便 用 户 识 别 坏 块 。 以 镁 光 公司 的 NAND Flash 产 品 为 例 ， 出 厂 时 厂家 会 在 初始 坏 块 的 第 一 个 空 帮 区 存储 坏 块 标志 信息 ， 也 即 对 于 页 大 小 为 8KB 的 心 
片 而 言 ， 坏 块 第 一 页 的 8192 列 地 址 处 被 厂商 标记 为 0x00 作 为 坏 块 的 标记 。 由 于 此 标记 信息 可 以 被 擦 除 ， 所 以 在 心 片 第 一 次 上 电 之 后 时 ， 首 先 应 该 扫描 整个 心 
片 的 坏 块 标记 地 址 处 的 内 容 ， 根 据 广 商 标识 的 0x00 找 到 所 有 初始 坏 块 ， 并 标记 在 坏 块 表 中 ，。 


初始 化 坏 块 检测 通常 在 NAND Flash 首 次 上 电 使 用 时 执行 一 次 即 可 ， 在 以 后 使 用 该 必 片 时 不 需要 再 次 执行 。 

2. 更 新 坏 块 表 

在 NAND Flash 的 使 用 过 程 中 ， 坏 块 同样 可 能 出 现 ， 这 一 般 是 由 两 种 原因 造成 的 : 其 一 ， 由 于 频繁 的 读 写 而 使 得 部 分 块 达 到 使 用 寿命 变 成 坏 块 ; 其 二 ， 由 
于 在 使 用 过 程 中 友 生 了 块 探 除 失败 或 者 页 编程 失败 的 情况 。 对 于 这 种 坏 块 ， 也 要 人 在 程序 运行 过 程 中 发 现 并 标记 为 坏 块 。 


在 擦 除 之 后 通过 读 取 NAND Flash 中 的 状态 寄存 器 内 容 ， 可 以 检测 到 擦 除 失败 或 者 页 编程 失败 的 坏 块 。 在 对 块 进行 擦 除 操作 之 后 ， 擦 除 失 败 则 状态 寄存 器 
中 的 值 为 1， 反 之 为 0。 也 即 若 检测 到 状态 寄存 器 的 值 为 1， 说 明 对 当前 块 的 擦 除 失 败 ， 需 要 将 该 块 添加 至 坏 块 表 。 


3. 屏 菩 坏 块 


坏 块 管理 模块 是 一 个 独立 工作 的 模块 ， 即 使 菜 些 块 已 经 损坏 ， 但 是 地 址 映射 逻辑 还 是 有 可 能 将 逻辑 地 址 映射 到 损坏 的 物理 块 上 ， 所 以 融 需 要 在 进行 地 址 映 
射 前 及 时 地 查找 坏 块 表 ， 用 以 检查 要 映射 的 块 是 否 为 坏 块 。 如 果 是 坏 块 ， 融 需要 对 逻辑 地 址 进行 重新 映射 ， 也 即 进行 坏 块 屏 菩 ， 以 免 造 成 数据 的 丢失 和 错误 。 


坏 块 屏蔽 的 方法 有 两 种 : 坏 块 蔡 换 和 坏 块 跳 过 。 坏 块 蔡 换 即 需要 在 每 个 NAND Flash 芯 片 中 保留 一 定量 的 预 留 区 用 以 替换 坏 块 ， 然 后 将 替换 的 坏 块 信息 记 
录 下 来 ， 作 为 坏 块 地 址 的 映射 管理 。 坏 块 跳 过 则 是 在 遇 到 坏 块 时 ， 直 接 忽略 该 坏 块 跳 到 下 一 个 物理 块 中 (也 即 块 地 址 +1) ， 直 到 当前 块 不 是 坏 块 为 止 ， 再 对 
当前 块 进行 访问 。 


为 了 便于 管理 并 且 充 分 利用 内 存 空间 ， 坏 块 表 在 内 存 中 采用 数组 的 组 织 结构 ，NAND Flash 坏 块 表 的 功能 是 查找 并 标记 坏 块 。 数 组 中 的 元 素 是 连续 存放 
的 ， 且 每 个 元 素 占用 内 存 相同 ， 可 以 通过 下 标 迅 速 访 问 数组 中 任何 元 素 ， 也 即 可 以 按照 NAND Flash 的 物理 块 号 迅速 查找 该 块 是 否 为 坏 块 。 采 用 数组 形式 的 坏 
块 表 ， 可 以 帮助 以 NAND Flash 为 基础 的 存储 系统 正常 工作 ， 防 止 对 坏 块 的 映射 ， 造 成 数据 丢失 。 


假设 NAND Flash 和 存储 器 由 12 组 存储 阵列 构成 ， 则 应 建立 12 个 数组 形式 的 坏 块 表 ， 每 组 NAND Flash 的 坏 块 单独 管理 ， 数 组 中 的 数据 位 宽 为 32 位 ， 每 1 位 
对 应 于 一 个 块 。 坏 块 数量 最 多 的 情况 丈 是 每 片 NAND Flash 中 的 所 有 块 均 为 坏 块 ， 即 每 片 NAND Flash 都 有 8192 个 坏 块 。 因 此 ， 每 个 坏 块 表 数 组 内 共有 256 个 
元 素 ， 元 素 的 下 标 是 从 0~255， 每 个 元 素 位 宽 为 32 位 ， 对 应 32 个 块 标记 ， 其 中 “0” 代 表 该 块 为 好 块 ，“1” 代 表 该 块 为 坏 块 。 在 每 次 对 NAND Flash 进 行 访问 
时 ， 先 根据 坏 块 表 判 断 当 前 处 理 地 址 所 在 的 块 是 否 为 坏 块 ， 如 果 为 坏 块 则 块 地 址 加 一 ， 加 一 之 后 的 块 地 址 变 为 当前 操作 的 块 地 址 。 再 根据 坏 块 表 判 断 该 块 地 址 
所 在 的 块 是 否 为 坏 块 ， 依 次 循环 下 去 ， 直 到 当前 处 理 地 址 对 应 的 块 为 好 块 为 止 ， 最 后 利用 该 地 址 对 NAND Flash 友 起 读 / 写 访问 等 操作 。 以 存储 用 户 数据 时 数据 
与 NAND Flash 物 理 块 地 址 的 对 应 天 系 为 例 进行 说 明 ， 其 示意 图 如 图 7-8 所 示 。 
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如 图 7-8 所 示 ， 用 户 数据 块 1 本 该 写 入 NAND Flash 中 块 1 处 ， 但 是 由 于 该 块 被 指示 为 坏 块 ， 所 以 将 用 户 数据 块 1 写 入 下 一 个 好 块 (也 即 块 2) 中 。 然 后 再 将 
用 户 数据 依次 按 顺 序 向 NAND Flash 中 写 入 。 用 户 数 据 块 3 应 该 写 入 块 4 中 ,但 是 坏 块 表 指示 块 4、5、6 都 为 坏 块 ， 所 以 用 户 数 据 块 3 在 写 入 时 需要 连续 跳 3 次 坏 
块 ， 直到 跳 到 块 7， 块 7 为 好 块 ， 所 以 将 数据 块 3 写 入 了 NAND Flash 的 块 7 中 。 


通过 建立 坏 块 表 ， 并 在 使 用 的 过 程 中 不 断 地 更 新 坏 块 表 ， 屏 菩 坏 块 ， 存 储 系统 束 可 以 跳 过 坏 块 ， 保 障 数据 的 完整 性 和 正确 性 。 
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三 部 分 ”固态 存储 安全 技术 


` 第 9 章 ”存储 数据 机 窗 性 保护 


. 第 10 章 NAND Flash 物 理 不 可 克隆 技术 


态 存储 设备 已 经 在 我 们 的 生活 、 工 作 中 逐渐 普及 ， 这 些 新 兴 存 储 设备 在 给 我 们 带 来 便利 的 同时 ， 其 中 所 存储 数据 的 安全 性 也 逐渐 引起 人 们 的 重视 。 


由 于 固态 存储 设备 与 传统 机 械 磁 盘 (HDD) 的 物理 存储 介质 不 同 ， 之 前 面向 机 械 磁盘 的 数据 安全 保护 机 制 往往 并 不 适合 直接 应 用 到 固态 存储 设备 上 。 这 就 
要 求 我 们 从 固态 存储 设备 数据 存储 介质 的 物理 特点 、 数 据 存储 原理 出 发 ， 研 究 基于 固态 存储 设备 的 存储 安全 技术 。 


本 书 的 第 三 部 分 将 主要 从 以 下 几 个 方面 讨论 固态 存储 安全 技术 。 


首先 是 数据 安全 删除 技术 。 固 态 存 储 设备 的 物理 存储 介质 主要 是 NAND Flash， 而 NAND Flash 有 其 独 有 的 物理 特性 : 数据 非 原 位 更 新 (out-of place 

update) ， 每 个 数据 块 都 具有 一 定 的 擦 写 寿 命 。 这 些 物理 特性 导致 用 户 在 应 用 层 实现 的 数据 删除 操作 往往 只 是 在 逻辑 上 实现 了 “数据 删除 ， 而 用 户 想 要 删除 
的 数据 其 实 还 完整 地 存储 在 物理 存储 介质 中 ， 这 就 给 敌手 留 下 了 恢复 用 户 重要 机 密 数 据 的 时 间 窗 口 与 可 能 性 。 为 了 保障 固态 存储 设备 上 数据 的 机 密 性 ， 学 术 界 
已 经 针对 固态 存储 设备 的 数据 安全 技术 提出 了 许多 方案 ,我 们 将 在 第 8 章 中 详细 介绍 。 


为 了 保障 固态 存储 设备 中 数据 的 机 密 性 ， 我 们 将 在 第 9 章 中 讨论 固态 存储 设备 中 数据 加 密 的 主要 算法 ， 如 XTS-AES 等 分 组 算法 。 在 传统 加 密 方案 中 ， 通 常 
考虑 的 敌手 类 型 是 被 动 地 窃听 ， 主 动 地 改变 、 擅 造 、 复 制 、 删 除 或 注入 消息 等 ， 甚 至 会 与 消息 的 发 送 者 或 接收 者 通信 ， 提 出 各 种 询问 ， 以 获取 对 其 有 用 的 信 
息 ， 并 假设 他 们 不 会 强迫 消息 的 发 送 者 或 接收 者 做 任何 事情 。 但 是 ， 面 对 强制 型 敌手 ， 敌 手 会 强迫 消息 的 发 送 者 或 接收 者 给 出 消息 或 用 于 产生 密 文 的 真实 参 
数 ， 甚 至 是 加 密 密 钥 。 因 此 面 对 强 制 型 敌手 的 胁迫 ， 为 了 欺骗 敌手 ， 又 让 敌手 不 能 觉察 出 这 种 其 骗 ， 就 需要 运用 可 否认 加 密 技 术 。 我 们 将 在 9.2 节 中 首先 简单 介 


绍 近 年 来 学 术 界 提出 的 多 种 可 否认 加 密 与 可 否认 认证 协议 方案 ， 然 后 根据 面向 系统 平台 的 不 同 ， 着 重 介 绍 可 否认 加 密 技 术 在 数据 存储 方面 ， 尤 其 是 固态 存储 设 
备 上 的 各 种 应 用 方案 。 


基于 固态 存储 设备 的 存储 介质 NAND Flash 的 物理 特性 ， 学 术 界 提出 了 利用 NAND Flash 芯 片 中 各 个 存储 单元 所 独 有 的 物理 特性 来 提取 设备 指纹 、 随 机 数 


和 人 ~ 


密 钥 等 信息 ， 用 于 保护 存储 设备 数据 的 安全 性 ， 我 们 将 在 第 10 章 中 对 该 内 容 进行 详细 介绍 。 第 11 章 则 会 对 存储 技术 进行 展望 。 


第 8 草 ”数据 安全 删除 


所 谓 数据 安全 删除 是 指 通过 各 种 技术 手段 ， 使 得 物理 存储 载体 中 的 数据 被 删除 后 不 可 恢复 ， 而 且 保 证 存储 设备 可 以 再 次 使 用 。 随 着 计算 机 技术 的 发 展 ， 个 
人 计算 机 、 智 能 手机 、 穿 戴 设 备 等 计算 设备 的 普及 ， 这 些 设备 中 的 机 密 、 隐 私 数据 需要 实现 安全 删除 ， 如 浏览 器 中 的 浏览 记录 ， 手 机 中 短信 、 照 片 、 录 像 ， 密 
钥 协 商 时 用 于 协商 会 话 密 钥 的 临时 值 ， 政 府 、 公 司 的 机 密 文件 等 。 然 而 ， 目 前 大 多 数 文 件 系统 中 的 删除 文件 ， 只 是 通过 修改 文件 的 元 数据 ， 指 示 该 文件 被 “ 删 
除 ”， 但 该 文件 的 所 有 内 容 仍然 完整 保留 在 物理 存储 介质 上 。 所 以 ， 在 现 有 的 大 多 数 存 储 系统 中 ， 用 户 “ 删 除 ” 数 据 后 ， 只 是 实现 了 目标 删除 数据 不 可 被 上 层 
系统 访问 ， 而 不 是 不 可 恢复 。 机 械 磁 盘 等 基于 磁 介 质 的 存储 设备 的 数据 更 新 是 基于 原 位 更 新 (in-place update) 原理 ， 目 前 针对 磁 介质 已 经 提出 了 多 种 基于 
重 写 的 安全 数据 删除 方案 。 但 是 由 于 NAND Flash 器 件 有 着 特殊 的 物理 性 质 ， 即 先 擦 除 再 写 入 、 编 程 与 擦 除 操作 的 基本 单位 不 一 样 、 数 据 更 新 基于 非 原 位 更 
新 ， 这 使 得 针对 基于 磁 介 质 的 存储 设备 的 数据 安全 删除 方案 不 适用 于 基于 NAND Flash 的 存储 设备 。 随 着 基于 NAND Flash 的 存储 设备 的 普及 ， 提 出 一 种 面向 
NAND Flash 的 数据 安全 删除 方案 已 经 成 为 一 个 重要 的 研究 内 容 。 


8.1 基于 NAND Flash 的 存储 设备 访问 层次 模型 


由 于 对 存储 介质 的 访问 需要 通过 不 同 层次 的 接口 来 实现 ， 为 保证 数据 安全 删除 方案 的 通用 性 ， 这 些 方案 通常 不 会 增加 访问 物理 存储 介质 的 接口 ， 而 只 是 修 
改 现 有 的 访问 接口 。 一 旦 某 个 数据 安全 删除 方案 确定 了 其 实施 的 目标 系统 层次 ， 丈 会 使 得 其 上 层 系 统 只 需要 调用 其 访问 接口 ， 便 可 以 实现 数据 安全 删除 ， 这 也 
是 计算 机 系统 多 层次 划分 的 一 个 好 处 。 


图 8-1 摘 述 了 基于 NAND Flash 介 质 的 存储 设备 的 系统 结构 ， 其 中 摘 述 了 基于 NAND Flash 的 存储 设备 的 典型 分 层 方 式 ,。 
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图 8-1 基于 NAND Flash 介 质 的 存储 设备 的 系统 结构 
最 底层 是 物理 存储 介质 层 ， 即 NAND Flash 物 理 心 片 。 


物理 存储 介质 层 的 上 一 层 是 控制 器 层 ，NAND Flash 器 件 通 过 一 个 控制 器 访问 。 控 制 器 负责 将 物理 介质 上 的 模拟 信号 (如 电压 ) 转化 成 上 层 可 用 的 数字 信 
号 ， 并 且 提 供 标准 的 硬件 接口 (如 SCSI 或 ATA 接 口 ) ， 以 允许 读 写 物理 介质 上 固定 大 小 的 内 容 。 磁 盘 驻 持原 位 更 新 ， 其 控制 器 将 每 一 个 逻辑 块 映射 到 相应 的 物 
理 介质 上 。 然 而 ，NAND Flash 不 支持 原 位 更 新 ， 因 此 需要 在 控制 器 层 中 完成 逻辑 块 地 址 (Logic Block Address，LBA) 到 NAND Flash 物 理 地 址 的 映射 功 
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目前 基于 NAND Flash 介 质 的 存储 设备 的 控制 器 层 有 两 种 形式 : 第 一 种 形式 是 在 控制 器 层 中 运行 闪存 转换 层 (Flash Translation Layer，FTL) 逻辑 来 完成 
地 址 映射 等 功能 ， 这 种 形式 广泛 地 应 用 在 SSD、U 盘 、SD 卡 、MicroSD 卡 、eMMC 卡 等 产品 中 ; 第 二 种 形式 是 控制 器 层 只 是 提供 信号 转化 、 标 准 硬件 接口 的 功 
能 ,控制 器 直接 操作 “ 裸 (raw) NAND Flash， 而 在 上 层 系统 中 (文件 系统 层 ) 完成 地 址 映射 等 功能 。 目 前 ， 在 控制 器 层 中 可 提供 一 个 安全 删除 物理 介质 
上 所 有 数据 的 命令 ， 但 是 该 命令 不 能 删除 特定 的 数据 对 象 ， 造 成 基于 控制 器 层 的 数据 安全 删除 方案 的 灵活 性 较 差 ， 而 且 对 所 有 数据 进行 删除 的 耗 时 会 随 着 
NAND Flash 容 量 的 变 大 而 不 断 增 加 。 


控制 器 层 的 上 一 层 是 驱动 层 。 驱 动 层 通过 提供 一 个 统一 的 接口 来 访问 不 同类 型 的 硬件 。 目 前 基于 NAND Flash 介 质 的 存储 设备 的 驱动 层 有 两 种 形式 : 第 一 
种 是 块 设备 驱动 (block device driver) 接口 ， 允 许 读 、 写 逻辑 地 址 块 。 块 设备 驱动 可 以 直接 通过 控制 在 控制 器 层 中 的 FTL 来 访问 NAND Flash 存 储 器 件 ; 第 
二 种 是 MTD (memory technology device) 驱动 ，MTD 可 用 于 直接 访问 “ 裸 ”NAND Flash， 即 NAND Flash 存 储 器 件 。 而 UBI (Unsorted Block 
Image) 设备 驱动 ， 即 无 排序 区 块 图 像 设 备 驱动 ， 建 立 在 MTD 驱 动 之 上 ， 它 在 访问 NAND Flash 的 很 多 方面 作 了 简化 。 


驱动 层 的 上 一 层 是 文件 系统 层 。 文 件 系统 利用 设备 驱动 层 的 接口 ， 对 文件 进行 读 、 写 、 新 建 、 修 改 、 删 除 等 操作 。 目 前 基于 NAND Flash 介 质 的 存储 设备 
构建 文件 系统 主要 有 两 种 方式 : 第 一 种 方式 是 使 用 块 驱动 程序 ， 模 拟 磁 介质 等 块 设备 的 访问 模式 ， 在 块 驱动 程序 之 上 通过 FTL 运 行 一 个 通用 文件 系统 (如 
FAT32、EXT2/3/4、NTFS 等 ) ， 使 得 就 像 访 问 磁盘 一 样 ， 通 过 基于 块 的 访问 接口 (block-based access interface) 来 访问 基于 NAND Flash 的 存储 设备 。 然 
而 ， 就 技术 角度 来 说 ，FAT32 等 通用 文件 系统 不 是 很 适合 NAND Flash 闪 存 ， 因 为 其 FAT 和 文件 目录 表 等 元 数据 需要 频繁 地 更 新 ， 而 NAND Flash 的 每 一 块 都 


只 能 支持 有 限 次 数 的 擦 写 操作 ， 这 样 束 会 增加 NAND Flash 的 损 耗 ， 增 加 系统 开销 ， 影 响 存储 设备 的 寿命 ， 第 二 种 方式 是 使 用 专门 为 NAND Flash 设 计 的 文件 
系统 ， 使 得 能 够 不 通过 块 驱动 程序 而 工作 。 目 前 主流 的 NAND Flash 专 用 的 文件 系统 有 YAFFS1、YAFFS2 以 及 UBIFS 等 ， 这 些 文件 系统 利用 MTD 驱 动 及 UBI 设 
备 驱动 直接 对 “ 裸 ”NAND Flash 进 行 操作 ， 而 不 用 执行 FTL。 这 些 专门 为 NAND Flash 设 计 的 文件 系统 都 是 基于 日 志 结 构 的 文件 系统 ， 并 且 是 开源 的 ， 如 果 使 
用 NAND Flash 和 存储 器 件 作 为 Linux 系 统 的 存储 设备 ， 则 首选 这 种 文件 系统 。 文 件 系统 层 可 以 访问 不 同类 型 的 硬件 ， 基 于 文件 系统 层 的 安全 删除 应 用 范围 广 

泛 ， 且 利用 NAND Flash 专 用 的 文件 系统 实现 安全 删除 不 受 写 入 和 探 除 粒度 的 限制 ， 但 利用 块 文件 系统 会 给 NAND Flash 器 件 市 来 巨大 的 磨损 ， 而 且 这 类 文件 
系统 比较 复杂 ， 安 全 删除 的 实现 难度 大 。 


基于 NAND Flash 和 存储 设备 的 存储 系统 的 最 上 层 是 应 用 程序 层 ， 用 户 可 以 在 图 形 界面 上 完成 各 种 数据 读 、 写 、 新 建 、 删 除 等 操作 。 一 个 安全 删除 用 户 应 用 
程序 只 能 与 兼容 ?OSIX 的 文件 系统 相互 作用 。 在 用 户 应 用 程序 中 进行 数据 安全 删除 ， 可 以 很 容易 地 删除 特定 的 数据 对 象 ， 灵 活性 好 ， 但 保证 数据 不 可 恢复 的 程 
度 最 小 ， 且 会 给 NAND Flash 器 件 市 来 相对 较 高 的 磨损 。 


忌 之 ， 对 于 数据 安全 删除 方法 来 说 ， 在 选择 使 用 目标 访问 层次 时 要 权衡 系统 效率 和 物理 器 件 磨损 两 个 因素 。 事 实 上 ， 抽 综 接 口 距离 存储 介质 越 远 ， 残 越 难 
保证 数据 的 不 可 恢复 性 。 在 物理 存储 介质 层 上 虽然 可 以 保证 删除 的 数据 确实 不 可 恢复 ， 但 是 需要 删除 所 有 数据 ， 灵 活性 较 差 。 在 应 用 程序 层 ， 可 以 较 简 单 地 区 
分 出 需要 安全 删除 的 数据 ， 但 下 层 可 能 不 会 对 目标 数据 进行 删除 操作 。 从 下 层 到 上 层 ， 每 一 个 抽象 层 都 阻碍 了 直接 访问 物理 介质 ， 因 此 使 得 数据 安全 删除 方案 
变 得 复杂 。 例 如 ， 控 制 器 写 新 数据 ， 但 是 物理 介质 上 可 能 合 有 剩余 数据 ， 文 件 系 统 重 写 一 个 逻辑 块 ， 但 是 设备 驱动 会 将 此 块 重新 映射 到 一 个 新 块 ， 将 原来 的 数 
据 保 留 。 低 层次 可 以 确保 数据 安全 删除 ， 但 无 法 自己 区 分 要 删除 的 数据 。 高 层次 知道 要 删除 哪些 数据 ， 但 是 无 法 直接 执行 删除 操作 。 因 此 ， 当 某 层 不 能 实现 数 
据 安 全 删除 时 ， 可 以 利用 文件 系统 层 向 更 低层 传递 删除 对 象 的 信息 以 实现 数据 安全 删除 ， 这 样 可 使 数据 安全 删除 方法 更 为 高 效 。 


针对 基于 NAND Flash 介 质 的 存储 设备 的 数据 安全 删除 已 经 逐渐 引起 了 学 术 界 的 重视 ， 许 多 专家 学 者 已 经 提出 了 相应 的 解决 方案 ， 接 下 来 我 们 将 结合 上 述 
基于 NAND Flash 的 存储 设备 访问 层次 模型 ， 具 体 讲解 各 个 NAND Flash 存 储 设备 访问 层次 上 具有 代表 性 的 数据 安全 删除 方案 。 


8.2 ”控制 器 层 万 案 


在 控制 器 层 可 以 读 写 大 小 一 定 的 数据 块 ， 因 此 可 以 实现 重 写 一 个 数据 块 的 内 容 ， 或 重 写 所 有 数据 块 。 但 是 在 控制 器 层 中 无 法 获知 数据 的 组 织 形式 ， 由 于 要 
删除 的 文件 可 能 占据 多 个 数据 块 ， 所 以 只 删除 一 个 数据 块 ， 往 往 不 能 保证 目标 文件 完全 被 删除 。 而 且 ， 在 控制 器 层 中 也 不 可 区 分 有 用 和 无 用 数据 ， 所 以 控制 器 
层 必 须 删 除 所 有 数据 块 来 达到 数据 安全 删除 的 目的 。 


SCSI 和 ATA 接 口 标 准 都 在 控制 器 层 提供 一 个 安全 删除 命令 (secure erase 或 secure initialize) ， 将 物理 介质 上 的 所 有 数据 删除 。 但 是 Wei 等 人 的 文章 指 
出 ， 在 SSD 控制 器 上 使 用 上 述 安全 删除 命令 来 实现 数据 安全 删除 ， 并 不 忌 是 能 够 成 功 。 在 有 些 情 况 下 ， 设 备 提示 操作 成 功 ， 但 是 数据 未 被 删除 ， 整 个 文件 系统 
仍然 可 用 。swanson 等 人 摘 述 了 一 种 在 控制 器 层 上 实现 的 、 可 验证 的 设备 数据 安全 删除 方案 。 对 存储 在 物理 介质 上 的 数据 全 部 加 密 人 存储 ， 密 钥 保 存在 硬件 控制 
器 上 ， 删 除数 据 时 首先 删除 控制 器 上 的 密 钥 ， 然 后 用 固定 的 数据 模式 对 设备 进行 两 次 重 写 、 擦 除 ， 最 后 给 控制 器 分 配 一 个 新 的 密 钥 。 


上 述 只 依靠 控制 器 层 中 的 信息 实现 数据 安全 删除 的 方案 只 能 实现 删除 存储 设备 上 的 所 有 数据 ， 而 不 能 实现 删除 特定 的 目标 数据 ， 灵 活性 较 差 。 为 了 增加 灵 
活性 ， 在 控制 器 层 中 实现 单个 文件 的 删除 ， 必 须 通过 上 层 文件 系统 传递 目标 文件 的 地 址 信息 。 接 下 来 介绍 结合 文件 系统 层 信 息 ， 通 过 修改 控制 器 层 中 的 闪存 转 
损 层 (FTL) 实现 的 较 灵 活 的 数据 安全 删除 方案 。 


8.2.1 Scrubbing 方 案 


在 2011 年 的 文件 和 存储 技术 (File and Storage Technologies，FAST) 会 议 上 ，Wei 等 人 提出 了 Scrubbing 方 案 。 


Wei 等 人 首先 验证 了 在 没有 实施 数据 安全 删除 方案 的 固态 硬盘 (SSD) 上 删除 数据 的 效果 。 他 们 先 在 SSD 上 生成 1000 个 文件 ， 然 后 删除 这 些 文件 ， 再 查找 
这 些 文件 内 容 。 实 验 友 现 ， 由 于 FTL 中 的 垃圾 回收 和 非 原 位 更 新 策略 ， 导 至 所 有 的 文件 都 还 存储 在 NAND Flash 上 ， 其 中 有 的 文件 甚至 遗留 了 16 个 由 于 复制 操 
作 造 成 的 匈 余 版 本 。 因 此 ， 在 基于 NAND Flash 的 存储 设备 上 增加 数据 安全 删除 功能 是 非常 有 必要 的 。 


为 了 验证 现 有 的 基于 磁 介 质 的 磁盘 的 数据 安全 删除 方案 在 基于 NAND Flash 的 SSD 上 的 有 效 性 ，Wei 等 人 构造 了 一 组 可 辨认 的 数据 模式 ， 称 为 “数字 指 
纹 ”， 在 SSD 中 写 满 指纹 数据 ， 用 来 验证 数据 安全 删除 的 效果 。 他 们 首先 验证 ATA 内 置 的 清理 命令 ，ATA 安 全 命令 特别 设置 擦 除 单元 (erase unit) 命令 ， 通 
过 写 全 0 或 全 1 来 擦 除 硬盘 上 所 有 用 户 可 用 的 区 域 。 通 过 在 12 个 不 同 的 SSD 上 做 实验 ， 其 中 8 个 SSD 支 持 ATA 的 安全 命令 ,但 这 8 个 SSD 中 有 1 个 存储 的 是 密 文 数 
据 ， 因 此 不 可 验证 数据 删除 效果 ， 剩 下 的 7 个 SSD 中 只 有 4 个 可 靠 地 执行 了 ATA 的 “ 擦 除 单元 ”命令 。 


Wei 等 人 还 验证 了 支持 删除 单个 文件 的 软件 协议 的 有 效 性 。 由 于 磁盘 和 SSD 都 没有 专门 的 命令 来 擦 除 特 定 区 域 ， 而 很 多 软件 支持 擦 除 单 个 文件 ， 这 些 软件 
都 使 用 了 与 基于 软件 的 全 磁盘 探 除 工具 相同 的 办 法 : 用 多 位 模式 多 次 重 写 文件 ， 然 后 进行 删除 。 而 且 一 些 程序 还 会 重复 写 硬 盘 上 的 空闲 区 域 ， 即 文件 系统 没有 
分 配给 某 个 指定 文件 的 区 域 ， 来 安全 地 擦 除 被 删除 的 文件 。 他 们 在 SSD 上 测试 了 13 个 删除 单个 文件 的 软件 协议 ， 实 验 结果 是 所 有 的 单个 文件 重 写 擦 除 协 议 都 失 
败 了 : 4% ~ 75% 的 文件 内 容 还 保留 在 SATA SSD 上 ，0.57% ~ 84.9% 的 数据 保留 在 了 基于 USB 驱 动 的 SSD 上 。 


接 下 来 Wei 等 人 又 测试 了 重 写 硬盘 上 的 空闲 区 域 的 效果 ， 通 过 用 4KB 和 大 于 512KB 的 文件 填 满 硬盘 ， 然 后 删除 所 有 小 文件 ， 重 写 空闲 区 域 100 次 。 实 验 结果 
是 无 论 硬盘 上 空闲 区 域 的 大 小 ， 重 写 空闲 区 域 都 不 能 成 功 地 删除 数据 ， 因 为 至 少 有 50% 以 上 文件 可 以 恢复 。 他 们 接 下 来 又 在 SSD 上 验证 了 磁盘 碎片 整理 的 效 
果 ， 实 验 表明 这 也 没有 起 到 良好 的 效果 。 


通过 以 上 验证 实验 表明 : 基于 磁 介 质 的 磁盘 的 单个 文件 数据 安全 删除 方案 并 不 适用 于 基于 NAND Flash 的 固态 硬盘 。 由 于 SSD 控 制 器 中 FTL 逻 辑 的 复杂 
性 ， 在 控制 器 的 上 层 (如 文件 系统 层 和 应 用 层 ) 获取 一 个 目标 文件 的 物理 存储 地 址 信息 很 困难 ， 因 此 要 实现 单个 文件 的 安全 删除 ， 就 不 能 只 在 控制 器 的 上 层 进 
行 操作 ， 而 需要 深入 到 控制 器 层 中 修改 FTL 的 相关 逻辑 。 


具体 地 讲 ，FTL 逻 辑 的 复杂 性 是 由 于 NAND Flash 特 殊 的 物理 性 质 造 成 的 。NAND Flash 写 操作 的 基本 单位 是 页 (大 小 为 512B、2KB 或 4KB 等 )， 而 擦 除 操 
作 的 基本 单位 是 块 ，1 个 块 中 包含 若干 页 (如 64 或 128 页 等 ) ， 写 数据 之 前 必须 先进 行 擦 除 操作 ， 这 丈 造 成 了 NAND Flash 非 原 位 更 新 的 特点 ， 即 更 新 数据 时 ， 
只 是 将 原 数 据 标 记 为 “已 删除 ”， 而 将 新 数据 写 入 其 他 空闲 位 置 。 所 以 ， 在 FTL 中 擦 除 一 个 逻辑 块 的 代价 很 大 ， 因 为 一 个 块 中 可 能 同时 包含 着 有 效 数据 页 和 无 
效 数据 页 。 这 束 要 求 先 将 此 块 中 的 有 效 数 据 复制 到 其 他 数据 块 中 ， 才 可 以 对 此 块 进行 擦 除 ， 但 这 不 可 避免 地 会 增加 系统 的 工作 量 ， 影 响 存储 系统 的 性 能 。 


然而 ，Wei 等 人 通过 换 一 种 角度 考虑 这 个 问题 ， 提 出 了 Scrubbing 方 案 : 写 操作 的 基本 单位 是 页 ， 而 且 在 FTL 中 可 以 实现 对 某 一 数据 页 进行 重 编程 〈 重 写 ) 
的 操作 ， 所 以 可 以 对 过 时 的 、 需 要 安全 删除 的 逻辑 数据 页 所 对 应 的 物理 页 进行 重 编程 操作 ， 用 编程 的 方式 实现 一 页 中 数据 的 删除 。 


结合 图 8-2 举 例 解 释 一 下 Scrubbing 的 操作 原理 ，NAND Flash 的 擦 除 操作 是 对 一 个 块 中 的 所 有 存储 单元 进行 放电 ， 从 而 所 有 存储 单元 都 变 成 “1”; 编程 
操作 是 对 一 个 页 中 的 部 分 存储 单元 充电， 造成 部 分 存储 单元 变 成 “0” ， 而 其 余 的 存储 单元 保持 “1” 不 变 。scrubbing 操 作 丈 是 对 已 编程 的 页 ( 合 
有 “0” 和 “1”) 进行 再 次 编程 操作 ， 使 得 该 页 中 所 有 存储 单元 都 变 成 “0”， 从 而 利用 页 编程 的 方式 实现 删除 一 个 页 中 数据 的 效果 。 
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图 8-2” ”Scrubbing 方案 的 操作 原理 


但 是 Scrubbing 操 作 也 会 市 来 数据 可 靠 性 问题 : 对 某 一 页 进行 Scrubbing 操 作 可 能 会 增加 该 页 所 在 块 的 相 邻 页 位 信息 的 出 错 率 ， 即 重复 编程 会 导致 其 他 页 
的 某 些 位 产生 翻转 ， 导 致 其 他 页 的 数据 产生 错误 。Grupp 等 人 的 文章 指出 重复 编程 的 影响 在 不 同 页 之 间 、 不 同 的 NAND Flash 设 备 之 间 差 异 很 大 ， 在 有 些 情 况 
下 ， 重 编程 操作 不 会 对 其 他 数据 页 产生 影响 。 


为 了 验证 Scrubbing 操 作 可 能 对 其 他 数据 页 产生 的 位 信息 造成 翻转 影响 的 大 小 ，Wei 等 人 做 了 如 图 8-3 所 示 的 验证 实验 。 


ge 个 块 在 此 块 中 的 所 有 





页 号 入 随机 数 





检查 此 块 中 的 其 他 页 数据 | ”「 读 取 此 块 中 的 
是 否 产生 位 翻转 现象 每 一 页 





对 此 其 中 的 荣 一 页 
进行 Scrubbing 操 作 


图 8-3 ”验证 Scrubbing 操 作 影 响 的 实验 步骤 


首先 擦 除 一 个 块 ， 然 后 向 此 块 中 的 每 一 页 写 入 随机 数据 来 代表 用 户 数 据 ， 再 随机 对 该 块 中 的 某 一 页 进行 一 次 Scrubbing 操 作 ， 然 后 读 块 中 其 他 页 的 数据 来 
检测 是 否 友 生 了 位 翻转 现象 。 由 于 NAND Flash 各 个 块 之 间 是 相互 独立 的 ， 所 以 只 需 检测 一 个 块 内 的 各 个 页 的 位 信息 翻转 现象 ， 而 不 必 检测 其 他 块 中 页 的 位 信 
息 。 他 们 在 16 个 不 同 的 SSD 中 做 了 重复 实验 。 实 验 结果 显示 ， 对 于 基于 SLC 类 型 NAND Flash 的 SSD， 即 每 个 存储 单元 中 只 存储 一 个 位 信息 ，Scrubbing 操 作 不 
会 造成 任何 位 翻转 现象 ， 因 此 对 于 基于 SLC 类 型 NAND Flash 的 存储 设备 来 说 ， 每 一 个 块 支持 的 Scrubbing 操 作 的 数目 区 是 一 块 中 的 页 数 。 但 是 对 于 基于 MLC 
类 型 NAND Flash 的 SSD， 即 每 个 存储 单元 中 存储 两 个 位 信息 ， 每 一 个 块 支持 的 Scrubbing 操 作 的 数目 束 比 较 复 杂 。 由 于 MLC 类 型 NAND Flash 的 每 个 存储 单 
元 中 存储 的 两 个 位 数据 属于 不 同 的 页 ， 对 其 中 一 页 进行 Scrubbing 操 作 时 忌 是 会 导致 男 外 一 页 产生 严重 的 位 翻转 现象 ， 因 而 需要 提前 将 不 需要 擦 除 的 页 的 内 容 
复制 到 其 他 空闲 位 置 中 ， 然 后 同时 将 成 对 的 页 的 数据 进行 Scrubbing 操 作 。 笠 运 的 是 ， 对 于 一 个 特定 模式 的 MLC 类 型 NAND Flash 心 片 ， 同 一 个 存储 单元 中 人 存 
储 的 两 个 位 数据 所 在 页 的 模式 是 固定 的 ， 所 以 比较 容易 定位 受 影响 的 页 。 


总 的 来 说 ，Scrubbing 操 作 造 成 的 编程 干扰 影响 在 物理 相 邻 的 单元 中 最 大 ， 判 断 对 一 页 进行 Scrubbing 操 作 是 否 安 全 ， 依 赖 于 其 所 在 块 中 其 他 页 的 数据 是 
否 会 产生 位 翻转 。 而 且 存 储 单元 密度 越 大 的 NAND Flash 心 片 的 Scrubbing 操 作 造 成 的 重复 编程 干扰 影响 越 大 ， 因 此 应 用 Scrubbing 方 案 时 ， 需 要 先 确定 目标 
NAND Flash 心 片 每 块 所 支持 的 最 大 的 重复 编程 数 ， 然 后 在 超出 系统 所 支持 的 纠 错 码 (ECC) 能 力 之 前 ， 先 将 目标 块 中 的 有 效 内 容 复制 到 其 他 空闲 位 置 ， 然 后 
再 将 此 块 进行 擦 除 ， 实 现 目标 页 的 安全 删除 。 

接 下 来 就 需要 在 FTL 中 添加 Scrubbing 操 作 ， 实 现 数据 的 安全 删除 。 根 据 在 性 能 和 安全 之 间 进 行 不 同 的 折 中 ，Wei 等 人 提出 了 三 种 在 FTL 中 添加 Scrubbing 
操作 的 策略 : 直接 Scrubbing 操 作 、 后 台 Scrubbing 操 作 和 基于 扫描 的 Scrubbing 操 作 。 


1. 直 接 Scrubbing 操 作 


直接 Scrubbing 操 作 是 指 当 系统 产生 过 时 的 、 已 更 新 的 数据 页 时 ， 立 即 对 相应 逻辑 页 对 应 的 物理 页 中 的 数据 进行 重 编程 操作 。 这 种 策略 的 安全 性 最 高 ， 
为 只 有 在 FTL 中 执行 Scrubbing 操 作 结 束 后 ， 其 他 新 的 编程 操作 才 人 允许 完成 。 多 数 情况 下 ， 直 接 9crubbing 操 作对 系统 性 能 造成 的 影响 很 小 ， 因 为 FTL 可 以 同时 
进行 新 的 编程 和 Scrubbing 操 作 。 


当 FTL 在 一 个 块 中 执行 的 Scrubbing 操 作 次 数 超过 这 个 块 在 不 导致 位 翻转 错误 条 件 下 所 能 承受 的 重 编程 的 最 大 次 数 时 ， 融 必须 要 复制 这 个 块 中 的 有 效 页 的 
内 容 到 一 个 新 的 空闲 块 中 ， 然 后 在 写 新 数据 操作 完成 乙 前 擦 除 此 块 。 因 此 对 于 可 承受 次 数 较 大 的 SLC 类 型 NAND Flash 心 请 不 会 产生 较 大 的 性 能 影响 ， 而 对 于 
存储 单元 密度 较 大 、 可 承受 次 数 较 小 的 MLC 类 型 NAND Flash 芯 片 则 可 能 会 产生 较 大 的 性 能 影响 。 


2. 后 台 Scrubbing 操 作 
后 台 Scrubbing 操 作 是 指 允 许 写 新 数据 操作 先 完成 ， 然 后 在 后 台 执 行 Scrubbing 操 作 ， 即 对 需要 安全 删除 的 物理 页 的 数据 进行 重 编程 操作 。 


后 台 Scrubbing 操 作 提 供 了 比 直接 Scrubbing 操 作 更 好 的 性 能 ， 但 是 后 台 Scrubbing 操 作 策 略 可 能 会 导致 短期 内 NAND Flash 上 存在 需要 安全 删除 的 数据 ， 
而 且 由 于 Scrubbing 操 作 可 能 会 与 其 他 操作 命令 产生 竞争 ， 因 而 也 可 能 会 降低 系统 性 能 。 


3. 基 于 扫描 的 Scrubbing 操 作 


基于 扫描 的 Scrubbing 操 作 是 在 FTL 中 增加 了 一 条 命令 ， 这 条 命令 可 以 扫描 一 定 学 围 的 逻辑 地 址 ， 然 后 对 所 有 被 映射 到 此 范围 内 且 被 更 新 的 物理 页 都 进行 
Scrubbing 操 作 。 


基于 扫 摘 的 Scrubbing 操 作 的 FTL 读 取 每 一 块 的 摘要 页 (保存 着 该 块 中 所 有 数据 页 的 基本 信息 ) ， 其 中 保存 着 该 物理 页 所 对 应 的 逻辑 地 址 ， 然 后 利用 FTL 中 
的 逆 映 射 信息 ， 即 NAND Flash 的 物理 地 址 到 上 层 逻 辑 地 址 的 映射 ， 检 查 每 一 块 中 是 否 含有 需要 执行 Scrubbing 操 作 的 目标 物理 页 。 如 果 含有 这 样 的 物理 
页 ，FTL 在 其 中 的 目标 物理 页 中 执行 Scrubbing 操 作 ， 但 是 如 果 需 要 执行 Scrubbing 操 作 的 物理 页 的 数目 超过 了 所 使 用 的 NAND Flash 的 每 一 块 所 能 承受 的 最 大 
scrubbing 操 作 数目 ， 则 需要 FTL 重 置 这 个 块 内 容 ， 然 后 对 此 块 进行 擦 除 。 


4. 三 种 策略 对 系统 的 性 能 影响 


Wei 等 人 使 用 的 FTL 是 基于 页 映射 的 ， 即 逻辑 地 址 映射 到 单个 物理 页 而 不 是 物理 块 。 这 个 FTL 使 用 的 是 日 志 结 构 写 策略 ， 当 一 块 写 满 之 后 ，FTL 必 须 移动 到 
一 个 新 的 已 擦 除 的 可 用 块 继续 写 ， 所 以 FTL 维 持 着 已 经 擦 除 的 可 用 块 ， 当 已 擦 除 的 可 用 块 用 完 时 将 会 执行 垃圾 回收 ， 通 过 合并 有 用 数据 释放 多 余 的 块 。 当 系统 
处 于 空闲 状态 时 ， 也 会 在 后 台 执 行 垃圾 回收 。 当 某 个 逻辑 地 址 更 新 数据 时 ， 原 映射 的 物理 页 的 数据 变 得 不 可 用 ， 但 是 还 保留 在 整个 NAND Flash 心 片 中 ， 成 为 
过 时 的 、 需 要 安全 删除 的 数据 。FTL 在 局 动 时 为 重建 映射 存储 了 一 个 逆 映 射 ， 即 从 物理 地 址 到 逻辑 地 址 的 映射 。 当 FTL 向 一 页 中 写 数 据 时 ，FTL 会 把 对 应 的 逻辑 
地 址 写 入 该 页 的 扩展 区 域 (OOB 区 ) 。 为 了 加 快 局 动 扫描 的 速度 ，FTL 在 每 一 块 的 最 后 一 页 人 存储 了 此 块 逆 映射 的 摘要 信息 。 


对 于 基于 SLC 类 型 NAND Flash 的 SSD 和 每 一 块 至 少 支 持 64 次 Scrubbing 操 作 的 基于 MLC 类 型 NAND Flash 的 SSD， 直 接 Scrubbing 操 作 和 后 台 Scrubbing 
操作 都 是 有 效 的 、 可 实现 数据 安全 删除 的 方案 。 但 是 对 于 每 一 块 支持 Scrubbing 操 作 数 较 少 的 SSD， 随 着 损耗 和 和 写 延迟 的 增加 ， 会 使 得 Scrubbing 操 作 给 系统 
带 来 的 性 能 损耗 较 大 。 


基于 扫 摘 的 Scrubbing 操 作 市 来 的 系统 延迟 主要 包括 两 部 分 ， 第 一 是 扫 摘 每 一 块 中 摘要 页 的 时 间 损 耗 ， 这 与 39D 的 容量 大 小 成 正比 ; 第 二 是 执行 
scrubbing 操 作 和 由 此 导致 的 垃圾 回收 时 间 的 损耗 ， 这 与 目标 逻辑 页 的 范围 大 小 有 关 ， 但 是 基于 扫描 的 Scrubbing 操 作 方 案 对 于 大 容量 9SD 也 是 比较 适合 的 。 


Scrubbing 操 作 可 能 影响 SSD 中 数据 的 长 期 完整 性 。 第 一 ，Scrubbing 操 作 会 增加 NAND Flash 块 的 编程 / 擦 除 (program/erase，P/E) 次 数 ， 从 而 影响 
SSD 的 使 用 寿命 。 第 二 ， 即 使 Scrubbing 操 作 不 会 立即 导致 其 他 数据 页 产生 位 翻转 错误 ， 但 会 影响 其 中 某 些 存储 单元 的 状态 ， 增 加 系统 错误 率 。 


为 了 解决 Scrubbing 方 案 给 NAND Flash 市 来 的 不 可 靠 性 ，Qin 等 人 在 2013 年 提出 了 smsD 方 案 。SmsD 方 案 在 3crubbing 方 案 的 基础 上 结合 了 RAID- 
5 (磁盘 风 余 阵列 技术 ) 对 每 一 页 的 数据 进行 校 验 ， 保 证 3crubbing 操 作 的 可 靠 性 。SmsD 方 案 在 基于 SLC 类 型 NAND Flash 的 SSD 中 进行 了 系统 原型 实现 ， 实 
验证 明 SmSD 可 以 很 好 地 弥补 Scrubbing 方 案 的 可 靠 性 问题 。 


8.2.2 ”基于 修改 典型 FTL 机 制 的 数据 安全 删除 方案 


由 于 NAND Flash 有 着 特殊 的 物理 性 质 : 非 原 位 更 新 ， 数 据 块 的 擦 写 寿 命 有 限 ， 为 了 将 NAND Flash 模 拟 为 像 磁盘 一 样 普 通 的 块 设备 ， 引 入 了 NAND 
Flash 闪 人 存 转换 层 (FTL) 。FTL 的 主要 功能 融 是 完成 逻辑 地 址 与 物理 地 址 的 映射 、 垃 圾 回收 和 使 用 均衡 。 接 下 来 介绍 在 修改 FTL 机 制 的 基础 上 实现 的 数据 安全 
删除 方案 。 


根据 FTL 逻 辑 地 址 映射 的 基本 单位 的 不 同 ， 地 址 映射 可 以 分 为 三 类 : 页 级 映射 、 块 级 映射 和 混合 映射 (具体 内 容 可 参考 5.3 节 ) 。 


Shin 在 2012 年 的 文章 中 分 析 了 在 各 种 典型 FTL 策 略 中 实现 数据 安全 删除 的 可 能 性 。 其 中 指出 ， 在 块 级 映射 FTL 中 实现 数据 安全 删除 较为 简单 。 这 是 因为 ， 
块 级 映射 FTL 中 地 址 映射 的 基本 单位 是 块 ， 当 有 数据 更 新 操作 时 ， 需 要 将 该 块 中 的 有 效 页 复制 到 一 个 新 的 空 几 块 中 ， 当 数据 复制 完成 后 束 可 以 擦 除 原来 的 数据 
块 ， 实 现 被 更 新 数据 的 安全 删除 。 但 这 种 方案 的 缺点 是 需要 复制 大 量 未 更 新 数据 ， 从 而 造成 系统 性 能 较 差 。 


类 似 地 ， 在 BAST 混 合 映射 FTL 中 也 可 以 较 简 单 地 实现 数据 安全 删除 ， 因 为 BAST FTL 的 数据 块 和 日 志 块 是 一 一 对 应 的 ， 日 志 块 中 空闲 页 的 数量 随 着 数据 的 
更 新 不 断 地 减少 ， 当 日 志 块 中 的 空 闪 页 用 完 时 ， 执 行 日 志 块 与 数据 块 中 内 容 的 合并 。 合 并 完成 后 束 可 以 将 原 数据 块 与 日 志 块 所 对 应 的 物理 块 进行 擦 除 ， 实 现 被 
更 新 数据 的 安全 删除 。 这 种 方案 的 缺点 是 安全 删除 工具 需要 知道 每 一 个 NAND Flash 块 中 的 页 数 ， 并 且 需 要 执行 至 少 与 每 块 页 数 相同 的 重 写 命 令 才能 用 完 日 志 
块 中 的 空 亲 页 ， 最 终 实 现 删 除 目标 页 的 效果 。 由 于 BAST FTL 自 身 机 制 的 缺陷 ， 这 种 方案 的 随机 写 性 能 较 差 。 


在 页 级 映射 FTL 上 却 难以 实现 数据 的 安全 删除 。 数 据 更 新 造成 的 无 效 数据 直到 垃圾 回收 的 时 候 才 会 被 擦 除 ， 而 且 只 有 在 执行 垃圾 回收 时 被 选择 的 目标 块 才 
会 被 擦 除 ， 如 果 空 闪 页 较 多 ， 系 统 不 会 执行 垃圾 回收 。 类 似 地 ， 在 FAST 渴 合 映射 FTL 中 也 难以 实现 数据 的 安全 删除 ，FAST FTL 的 一 个 日 志 块 对 应 多 个 数据 
块 ， 被 更 新 的 数据 遗留 在 日 志 块 中 ， 同 样 直 到 执行 垃圾 回收 ， 被 更 新 的 数据 页 所 在 的 块 被 选 为 垃圾 回收 对 象 时 ， 才 能 被 擦 除 ， 所 以 安全 删除 数据 的 时 间 同 样 是 
不 确定 的 。 


为 了 在 页 级 映射 FTL 实 现 快速 、 确 定 的 数据 安全 删除 ，Shin 在 2013 年 的 文章 中 通过 记录 页 映射 表 中 每 一 个 逻辑 页 的 重 写 次 数 ， 并 且 首 先 设 定 重 写 的 阔 值 , 
一 旦 某 个 膛 辑 页 的 重 写 次 数 超过 预先 设 定 的 阔 值 ， 就 会 引发 特殊 的 垃圾 回收 操作 ， 即 对 曾 被 映射 到 含有 目标 逻辑 页 的 物理 页 所 在 的 物理 块 进行 垃圾 回收 操作 ， 
将 其 中 的 有 效 数据 复制 并 保存 到 其 他 空闲 块 中 后 控 除 这 些 块 。 为 了 实现 这 种 特殊 的 垃圾 回收 策略 ， 需 要 在 地 址 映射 表 中 保存 所 有 逻辑 页 之 前 所 映射 过 的 物理 页 
言 息 ， 这 对 系统 的 SRAM 内 存 容量 的 要 求 有 所 提高 。 


为 了 验证 上 述 在 典型 FTL 机 制 中 增加 数据 安全 删除 方案 的 效果 ，shin 又 对 上 述 各 种 方案 进行 了 实验 验证 。shin 利 用 一 个 基于 数据 轨迹 驱动 (trace- 
driven) 的 模拟 器 ， 模 拟 了 4 路 2 通道 的 NAND Flash 设 备 ， 其 每 一 页 2KB， 每 块 64 页 ， 页 读 写 数 据 时 间 为 22/200hs， 块 探 除 时 间 是 2ms。 他 们 使 用 的 数据 轨迹 
来 源 于 基于 NTFS 上 的 安 半 程序 、 网 络 操作 、 编 辑 文件 等 操作 。 


实验 表明 ， 增 加 了 数据 安全 删除 功能 的 页 级 映射 FTL 的 系统 性 能 下 降 得 最 多 ， 这 是 因为 每 一 个 逻辑 页 所 映射 的 物理 页 可 能 散落 在 多 个 物理 块 中 ， 而 所 有 这 
些 物 理 块 都 必须 被 执行 特殊 的 垃圾 回收 后 才能 实现 数据 的 安全 删除 。 增 加 了 数据 安全 删除 功能 的 块 级 映射 FTL 只 需要 擦 除 少量 的 含有 有 效 页 的 数据 块 ， 因 而 性 
能 下 降 较 少 。 在 增加 了 数据 安全 删除 功能 的 BAST 混 合 机 制 FTL 中 ， 数 据 块 和 对 应 的 日 志 块 都 需要 被 执行 特殊 的 垃圾 回收 操作 ， 因 而 比 改 进 的 块 级 映射 FTL 性 能 
下 降 得 稍 多 。 同 时 ， 增 加 了 数据 安全 删除 功能 的 页 级 映射 FTL 的 系统 性 能 下 降 的 幅度 随 着 内 存 SRAM 的 容量 增 大 而 减 小 ， 因 为 内 存 SRAM 容 量 的 增 大 有 助 于 系 
统 更 新 操作 次 数 的 减少 。 


忌 之 ， 在 上 述 基于 修改 典型 FTL 机 制 的 数据 安全 删除 方案 中 ， 性 能 最 好 的 是 改进 的 页 级 映射 FTL 的 性 能 ， 较 适合 于 内 存 SRAM 容 量 较 大 的 系统 ， 然 后 是 改进 
的 BAST 混 合 映射 FTL 的 性 能 ， 较 适合 于 内 存 SRAM 容 量 较 小 的 系统 ; 而 改进 的 块 级 映射 FTL 性 能 较 差 ， 这 是 由 于 块 级 映射 本 身 的 地 址 映射 贫 略 造成 的 ， 但 是 其 
性 能 也 随 着 内 存 SRAM 的 容量 增 大 而 逐渐 提高 。 


8.2.3 ”NFPS: 不 可 检测 的 数据 安全 删除 方案 


在 需要 对 敏感 数据 进行 删除 时 ， 数 据 拥 有 者 希望 达到 的 目的 往往 是 : 将 敏感 数据 从 物理 仓储 介质 中 完全 删除 。 这 是 非 钊 天 键 的 ， 因 为 这 不 仅 关 系 到 用 户 的 
个 人 隐私 ， 而 且 遵 守 了 数据 存储 政策 的 相关 规定 。 例 如 ， 第 五 届 数 据 保护 法 案 指 出 数据 的 保存 时 间 不 能 长 于 数据 的 有 效 时 间 。 所 以 ,数据 的 安全 删除 应 该 实现 
的 效果 是 : 在 数据 被 视 为 无 效 时 立即 被 安全 删除 ， 即 从 物理 存储 介质 中 删除 。 这 残 意 味 着 数据 需要 达到 的 安全 删除 保障 (Secure Deletion 
Guarantee，SDG) 是 : 敌手 既 不 能 恢复 被 删除 的 数据 ， 也 不 能 获得 已 删除 数据 的 任何 信息 。 


在 现在 的 计算 机 系统 中 ， 实 现 数据 删除 的 安全 保障 很 困难 。 首 先 ， 传 统 的 文件 系统 (如 FAT32、EXT3、EXT4 和 NTFS 等 ) 在 删除 数据 时 只 是 修改 相应 的 元 
数据 ， 如 通过 修改 块 分 配 表 (BAT) 来 删除 数据 ， 而 目标 删除 数据 的 真正 内 容 仍 然 保 存在 物理 存储 介质 上 ， 在 这 种 情况 下 ， 敌 手 很 容易 恢复 已 经 “删除 ”的 数 
据 。 其 次 ， 传 统 的 数据 安全 删除 方案 依赖 于 数据 重 写 或 者 加 密 ， 目 标 删 除数 据 会 在 计算 机 系统 的 所 有 层次 中 留 下 痕迹 ， 政 手 可 利用 这 些 痕迹 得 到 “已 删除 ” 数 
据 的 信息 。 


面向 机 械 磁 盘 的 数据 安全 删除 方案 大 多 是 利用 磁盘 可 原 位 更 新 的 特点 ， 通 过 目标 删除 数据 被 随机 数 或 新 的 数据 重 写 来 删除 。 但 是 NAND Flash 有 着 独特 的 
物理 特性 ， 所 以 ， 基 于 磁盘 的 数据 安全 删除 方案 都 不 适用 于 基于 NAND Flash 的 存储 设备 。 


为 了 达到 数据 删除 的 安全 保障 ，Jia 等 人 提出 了 NFPS (NAND Flash Partial Scrubbing) 方案 : 通过 在 Flash 转 化 层 (FTL) 中 增加 不 可 检测 的 数据 安全 删 
除 方案 ， 在 保证 删除 数据 的 同时 隐藏 数据 删除 的 操作 ， 使 得 政 手 不 能 获得 已 删除 数据 的 任何 信息 。 


FTL 存 在 于 基于 NAND Flash 的 人 存储 设备 中 ， 介 于 物理 存储 介质 与 文件 系统 之 间 ， 屏 菩 了 NAND Flash 的 物理 特性 ， 使 得 上 层 系统 可 以 通过 块 设备 接口 
(block device interface) 对 NAND Flash 进 行 透明 的 访问 。 选 择 在 FTL 中 实现 具有 安全 保障 的 数据 删除 具有 以 下 优点 : 


1) 基于 FTL 的 NAND Flash 存 储 设备 已 非常 普及 。 如 智能 手机 、 笔 记 本 电脑 、 台 式 计算 机 、 照 相机 中 的 存储 设备 。 这 些 设备 的 普及 使 得 FTL 技 术 得 到 广泛 
的 应 用 。 


2) NAND Flash 独 有 的 物理 特点 为 实现 数据 删除 的 安全 保障 提供 了 可 能 。 
3) 相 较 于 文件 系统 层 ，FTL 含 有 较 少 的 代码 ， 且 在 FTL 中 实现 数据 删除 的 安全 保障 ， 不 会 影响 存储 系统 分 层 独 立 设计 的 特点 。 


在 NAND Flash 中 实现 的 数据 安全 方案 主要 就 是 数据 重 写 和 加 密 ， 其 中 对 NAND Flash 进 行 数据 重 写 就 是 基于 Scrubbing 方 案 。 但 是 ， 之 前 所 有 的 方案 都 
不 能 实现 具有 安全 保障 的 数据 删除 。 


首先 ， 传 统 的 FTL 通 常 采 取 日 志 结 构 写 机 制 ， 即 顺序 分 配 NAND Flash 的 块 ， 并 顺序 分 配 一 个 块 中 的 页 。 所 以 ， 目 标 删 除数 据 的 存储 情况 将 会 直接 影响 
NAND Flash 上 的 存储 布局 (storage layout) ， 也 就 是 说 奋 只 删除 目标 删除 数据 本 身 ， 但 目标 删除 数据 在 NAND Flash 的 存储 布局 上 仍然 留 下 了 痕迹 。 利 用 
数据 重 写 和 加 密 的 数据 安全 删除 方案 都 没有 考虑 消除 这 些 痕迹 ， 所 以 敌手 可 通过 分 析 数 据 之 间 的 关系 来 恢复 或 者 部 分 恢复 “已 删除 ”的 数据 。 


完全 消除 目标 删除 数据 在 存储 系统 上 留 下 的 痕迹 ， 需 要 对 整个 NAND Flash 存 储 系统 进行 重新 组 织 和 设计 ， 只 有 这 样 才能 保证 目标 删除 数据 存在 与 否 都 不 
会 对 存储 系统 造成 影响 。 但 重新 对 存储 系统 进行 设计 是 非常 复杂 的 ， 并 且 代 价 非常 大 。 直 观 地 讲 ， 如 果 能 隐藏 删除 数据 的 痕迹 ， 使 得 政 手 无 法 发 现存 在 删除 操 
作 ， 这 样 就 能 大 大 减少 政 手 通 过 分 析 未 删除 数据 来 恢复 或 获知 “已 删除 ”数据 的 可 能 性 。 


为 了 实现 上 述 目 的 ，Jia 等 人 针对 基于 NAND Flash 的 存储 设备 提出 了 一 个 新 的 概念 “不 可 检测 的 数据 安全 删除 ”， 其 主要 安全 特性 包括 : 第 一 ， 目 标 删 除 
数据 完全 从 NAND Flash 上 删除 ， 这 可 以 保证 政 手 不 能 直接 从 NAND Flash 物 理 人 存储 上 访问 目标 删除 数据 ; 第 二 ， 隐 藏 目标 删除 数据 的 删除 痕迹 /历史 ， 这 可 以 
保证 敢 手 不 知道 曾经 友 生 过 删除 操作 的 位 置 ， 从 而 降低 收 手 根据 删除 痕迹 ， 通 过 分 析 数 据 乙 间 的 关系 来 恢复 或 者 部 分 恢复 “已 删除 ”的 数据 的 可 能 性 。 


1. 消 除数 据 结 构 性 痕迹 的 重要 性 


通过 二 又 树 可 以 很 好 地 说 明 删 除数 据 结 构 性 痕迹 的 重要 性 。 如 图 8-4 所 示 ， 依 次 插入 数据 节点 2、11、13、14、1， 将 获得 T1 时 刻 的 存储 状态 ， 删 除数 据 节 
所 2 后 ， 将 获得 T2 时 刻 的 存储 状态 。 但 是 ， 如 果 只 是 依次 插入 数据 节点 11、13、14、1,， 我 们 将 获得 T 3 时 刻 的 存储 状态 。 从 图 中 可 以 看 出 ， 由 于 数据 节点 2 的 
然 影响 着 系统 的 存储 状态 。 通 过 观察 12 时 刻 的 存储 





a) 包含 删除 操作 b) 不 包含 删除 操作 


图 8-4 ”二 又 村 有 无 删除 操作 对 比 


随 着 基于 NAND Flash 的 存储 设备 的 普及 ， 在 NAND Flash 存 储 介质 中 实现 数据 安全 删除 也 越 来 越 重要 。 接 下 来 利用 比特 币 (bitcoin) 的 例子 ， 对 基于 重 
写 和 基于 加 密 的 NAND Flash 上 的 数据 安全 删除 方案 提出 具体 的 攻击 情景 。 


图 8-5 是 从 用 户 设 备 上 截取 的 部 分 真实 的 比特 币 的 交易 数据 。 图 中 的 4 个 交易 A、B、C、D 人 存储 在 基于 NAND Flash 的 存储 设备 上 ， 每 个 交易 都 分 别 存 储 在 
不 同 的 NAND Flash 页 上 ， 由 于 NAND Flash 一 般 采 取 日 志 结 构 写 的 方式 来 减少 重 写 的 频率 ， 所 以 这 些 交 易 是 依次 被 顺序 写 入 NAND Flash 的 不 同 页 中 的 。 


Transaction format: Date, Description, Amount (BTC), Amount (S$) 
Transaction A: 

Tue Jan 14 22:18:25 2014, Received with 
lBEzVfsppyhCZczWYybjR9{3ZPrAPbNBz7K, 0.006, 3.00 
Transaction B: 

Wed Jan 15 12:51:34 2014 Recelved with 


lBEzVfsppyhCZczWybjR9f3ZPrAPbNBz7K, 0.10131 50.00 


, ] 
Transaction C: 


Thu Jan 16 01:10:23 2014, Sent to 1MpqlFwxWUCohqfSczQywLN3btAp46VbnyY, 
-0.016131, -7.00 | 


Transaction D: 
Fri Jan 17 12:16:25 2014, Received with 
lBEzVfsppyhCZczWybjR9{3ZPrAPbNBz7K, 0.1 45.71 





图 8-5 ”比特 币 的 交易 数据 


对 基于 Scrubbing 的 数据 安全 删除 的 攻击 : 如 图 8-6a 所 示 ， 用 户 将 交易 A、B、C、D 依 次 写 入 NAND Flash 中 ， 然 后 用 Scrubbing 技 术 (对 数据 页 中 数据 
写 为 全 “0”) 删除 交易 C， 导 致 交易 C 所 在 的 物理 页 变 成 一 个 全 “0” 页 。 政 手 通 过 获取 NAND Flash 的 存储 状态 ， 可 以 很 容易 地 看 到 在 全 “0” 页 处 曾经 执行 
过 删除 操作 。 更 重要 的 是 ， 政 手 可 以 通过 分 析 相 邻 数据 页 信息 获得 “已 删除 数据 ”交易 C 的 信息 。 


1) 因为 交易 C 一 定 发 生 在 交易 B 与 交易 D 之 间 ， 所 以 交易 C 是 发 生 在 2014 年 1 月 15 日 (周三 ) 12: 51: 34 与 2014 年 1 月 17 日 ( 周 五 ) 12: 16: 25 之 间 。 


2) 交易 C 可 能 是 向 另外 一 个 比特 币 地 址 发 送 0: 016131BTC。 


3) 交易 C 可 能 利用 的 比特 币 地 址 是 : 1BEzVfsppyhCZczWybjR9f3ZPrAPbNBz7K。 因 为 这 个 地 址 曾经 被 用 户 用 来 接收 比特 币 ， 而 且 比 特 币 协议 规定 用 户 
只 能 用 接收 过 比特 币 的 地 址 来 发 送 比特 币 。 


通过 进一步 观察 利用 比特 币 地 址 1BEzVfsppyhCZczWybjR9f3ZPrAPbNBz7K 的 块 链 ， 政 手 可 以 发 现 同 时 满足 1) 和 2) 的 交易 ， 获 得 交易 C 的 接收 地 址 : 
1Mpgq1FwxWUCohqfsczQywLN3btAp46V bnyY。 


对 基于 加 密 的 数据 安全 删除 方案 的 攻击 : 如 图 8-6b 所 示 ， 用 户 将 交易 A、B、C、D 的 数据 加 密 后 依次 写 入 NAND Flash 中 ， 并 通过 删除 交易 C 对 应 的 加 密 
密 钥 来 删除 交易 C 的 数据 。 当 敌手 获得 存储 设备 后 ， 由 于 交易 A、B、D 的 数据 都 能 够 正常 解密 ， 而 C 的 数据 无 法 解密 ， 从 而 敌手 也 能 够 知道 在 B 与 D 之 间 执 行 过 
数据 删除 操作 。 通 过 加 密 后 的 交易 A、B、D 的 数据 ， 政 手 仍然 能 够 利用 数据 之 间 的 相关 性 ， 得 到 交易 C 的 信息 。 


(1) 写 入 A ,B,C 和 D 





je 通过 Scrubbing 删 除 C 





a) 对 基于 Scrubbing 的 数据 安全 删除 的 攻击 


与 A,B,C 和 D 


(1) _ 加密 后 的 数据 。| | | se) | sa 


通过 删除 C 对 应 


| 的 密 钥 来 删除 C 
(22 








b) 对 基于 加 密 的 数据 安全 删除 的 攻击 


图 8-6 ”针对 基于 scrubbing 和 加 密 的 数据 安全 删除 的 攻击 


2. 政 手 模型 、 假 设 与 安全 定义 


Jia 等 人 在 设计 NFPS 方 案 时 主要 考虑 的 是 对 NAND Flash 存 储 设备 可 进行 一 次 访问 (one-time access) 的 敌手 。 通 过 对 存储 设备 进行 访问 ， 政 手 可 以 获得 
NAND Flash 的 逻辑 镜像 和 物理 镜像 ， 然 后 可 以 利用 数据 分 析 工 具 对 镜像 进行 分 析 。 这 种 敌手 模型 是 很 常见 的 ， 比 如 敌手 进入 宾馆 房间 ， 获 得 NAND Flash 存 
储 设备 的 镜像 ， 或 者 在 被 挟持 情况 下 ，NAND Flash 存 储 设备 被 没收 等 。 为 了 简化 问题 ， 假 设 敌 手 只 能 进行 离线 攻击 ， 而 不 能 进行 在 线 攻击 。 也 就 是 说 在 政 手 
获得 镜像 前 ， 存 储 设 备 已 经 从 主机 端 安全 移 除 ， 敌 手 无 法 获得 存储 设备 运行 时 的 内 存 信息 (如 通过 cold-boot 攻 击 ) 。 


jia 等 人 假设 要 保护 的 数据 都 是 以 字 节 为 单位 的 。 也 融 是 说 ， 收 手 要 想 获 得 一 字 节 的 信息 ， 必 须 获得 其 中 所 有 8 位 数据 。 比 如 ， 字 符 A 的 二 进 制 表示 
是 “01000001”， 如 果 最 右 侧 的 “1” 变 成 “0”， 变 成 二 进 制 “01000000”， 则 表示 的 是 字符 “@”， 这 样 就 完全 改变 了 含义 。 这 种 假设 适用 于 所 有 文本 文 
件 、 字 节 编 码 文 件 (如 视频 、 音 频 、 图 像 等 ) ， 以 及 加 密 数据 等 。 


下 面 对 “ 不 可 检测 的 数据 安全 删除 ”方案 给 出 正式 的 定义 。 


假设 由 是 一 个 数据 安全 删除 机 制 ， 并 且 运 行 在 一 个 基于 NAND Flash 的 存储 设备 上 。 假 设 S 是 一 系列 对 存储 设备 的 访问 操作 ， 包 括 读 、 写 和 按 除 操作 。S= 
{Oto，OtT1，…，Ofti，…，Otnj， 其 中 Oti 表 示 一 个 在 时 间 ti 对 存储 设备 的 访问 操作 ，0<isn。NAND Flash 存 储 设备 在 ta 时 间 被 正常 安全 地 从 主机 端 移 除 ， 政 手 
在 tb 时 间 获 得 NAND Flash 的 镜像 ， 其 中 tn <ta<tb。 当 且 仅 当中 在 满足 以 下 两 个 条 件 : 1) 政 手 无 法 获得 任何 用 户 在 ta 时 间 之 前 删除 的 数据 ; 2) 假设 p 是 政 手 
识别 出 由 中 存在 删除 操作 的 概率 ，p 趋 向 于 0， 才 能 称 由 为 一 个 “不 可 检测 的 数据 安全 删除 ”方案 。 

3. 方 案 介 绍 

Jia 等 人 提出 的 NFPs 方 案 的 主要 目的 是 安全 并 且 不 可 检测 地 (securely and undetectably) 实现 从 NAND Flash 中 删除 数据 。 

利用 Scrubbing 技 术 (将 一 页 中 的 数据 全 部 变 成 “0”) 和 块 擦 除 操作 (将 一 块 中 的 数据 全 部 变 成 “1”) 虽然 可 以 实现 将 目标 数据 本 身 删 除 ， 但 是 


全 “0” 页 和 全 “1” 块 的 存在 导致 在 存储 设备 上 留 下 了 “已 删除 数据 ”的 痕迹 ， 使 得 敌手 可 能 根据 相 邻 数据 之 间 的 相关 性 ， 恢 复 或 者 部 分 恢复 已 删除 数据 的 信 
。 为 了 避免 上 述 信 息 泄露 ，Jia 等 人 提出 了 部 分 Scrubbing 技 术 (Partial Scrubbing) 。 


el 


部 分 Scrubbing 技 术 的 实现 目标 是 删除 目标 数据 ， 同 时 消除 数据 删除 的 痕迹 ， 保 证 目标 删除 数据 不 能 被 恢复 。 部 分 Scrubbing 技 术 包 括 部 分 页 重 编程 
(Partial Page Reprogramming，PPR) 操作 和 部 分 块 擦 除 (Partial Block Erasure，PBE) 操作 。 


(1) 部 分 页 重 编程 


部 分 页 重 编程 操作 利用 的 是 NAND Flash 特 殊 的 物理 性 质 : 由 于 制造 过 程 的 差异 性 ， 各 个 存储 单元 的 编程 操作 的 辣 值 电压 不 一 样 ， 即 每 个 存储 单元 在 编程 
操作 前 的 电压 和 编程 操作 后 的 电压 是 不 一 样 的 。 


在 每 一 个 NAND Flash 心 片 的 数据 手册 中 ， 有 一 个 参数 称 为 页 编程 时 间 (tPROG) ， 这 个 参数 是 指 在 编程 过 程 (充电 ) 中 ， 一 页 中 所 有 的 存储 单元 从 逻辑 
状态 “1” 变 成 逻辑 状态 “0” 所 需要 的 时 间 。 如 果 缩 短 对 一 页 中 存储 单元 的 编程 (全 写 为 “0”) 时 间 ， 就 会 造成 只 有 一 部 分 存储 单元 完成 充电 ， 从 逻辑 状 
态 “1” 变 成 逻辑 状态 “0” ， 而 其 他 的 存储 单元 仍 会 保持 逻辑 状态 “1” 。 


一 个 部 分 页 重 编程 操作 是 指 在 一 个 已 被 写 入 数据 的 页 中 ， 进 行 一 次 或 多 次 (PPNum) 部 分 编程 操作 ， 每 次 编程 操作 只 持续 一 段 缩短 的 时 间 (tp) 的 操 


作 ， 使 得 该 页 中 的 只 有 部 分 数据 被 改变 ， 即 只 有 一 部 分 处 于 逻辑 状态 “1” 的 存储 单元 变 成 逻辑 状态 “0”， 而 其 他 存储 单元 保持 其 原 有 的 逻辑 状态 不 变 。 


利用 部 分 页 重 编程 操作 来 实现 一 页 数据 的 删除 ， 需 要 先 确定 部 分 页 编程 的 次 数 (PPNum) 和 每 次 部 分 页 编程 的 执行 时 间 (tp) 。 可 以 通过 如 下 步骤 确定 


这 两 个 参数 : 
1) 将 tp 初始 化 为 一 个 较 小 值 (如 1hs) 。 
2) 根据 图 8-7 中 算法 计算 出 对 应 的 PPNum。 
3) tp 按照 一 定 的 增 量 递 增 ， 并 分 别 计算 出 对 应 的 PPNum， 当 tp 增加 到 大 于 tprOG 或 者 计算 出 对 应 的 PPNum 为 O 时 停止 。 


4) 选择 tpxPPNum 最 小 的 一 组 (排除 PPNum 为 0 的 情况 ) ， 作 为 目标 NAND Flash 心 片 的 部 分 页 重 编程 操作 的 次 数 和 每 次 执行 时 间 。 


算法 确定 每 次 执行 部 分 页 重 编程 时 间 思 ， 求 对 应 的 部 分 页 重 编程 操作 次 数 PPNum 

Require: 

BlockNum: 随机 选择 的 一 个 物理 块 号 ; 

PageNum: 从 选择 块 中 随机 选择 的 一 页 ; 

b,: 每 次 执行 部 分 页 编程 时 间 。 

Ensure: 

PPNum: 确定 的 部 分 页 重 编程 时 间 所 对 应 的 部 分 页 重 编程 操作 次 数 。 

: PPNum = 0; 

Erase the block identified by BlockNum; 

Write random information to the page identified by PageNum; 

Stroe the data of the selected page to PreNum:; 

Flag = 0; 

While Flag == 0 do; 
Perform a PPR operation on the selected page based ont,; 
terPNvnm: 


Compare the data in the selected page with PreNum in bytes; 


] 

pA 
3: 
4: 
3 
0: 
下 
8 : 


‘OO 


if At least one bit flips in eah non-all ~zero byte then 
Flag = 1; 
if All! the bits have turned to “0 then 
PPNum = 0: 
end if 
end if 


end while 
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人 DPT OO 


一 
OO Wn 





图 8.7 由 一 个 确定 的 tp 来 确定 PPNum 的 过 程 
接 下 来 介绍 图 8-7 中 由 一 个 确定 的 tp 来 确定 PPNum 的 过 程 。 
首先 ， 擦 除 一 个 随机 选择 的 块 (BlockNum) ， 并 在 此 块 中 随机 选择 一 页 (PageNum) ， 将 此 页 写 满 随机 数 后 读 出 此 页 数据 (PreNum) 。 然 后 , 利用 
确定 的 tp 对 选中 的 页 进行 一 次 部 分 页 重 编程 操作 。 部 分 页 重 编程 操作 执行 结束 后 ， 选 中 页 的 部 分 存储 单元 会 由 于 充电 成 功 而 发 生 位 翻转 现象 ， 即 由 逻辑 状 
态 “1” 变 成 逻辑 状态 “0”。 再 次 读 选 中 页 的 数据 ， 并 与 PreNum 逐 字 节 进行 比较 。 接 下 来 ， 在 选中 页 中 再 次 执行 部 分 页 重 编程 操作 ， 并 记录 部 分 页 重 编程 操 
作 的 执行 次 数 PPNum ， 直 到 观察 到 所 有 的 非 全 0 字 节 中 都 至 少 有 1 个 存储 单元 发 生 了 位 翻转 现象 。 注 意 ， 如 果 在 选中 页 中 执行 部 分 页 重 编程 操作 的 过 程 中 ， 观 


察 到 选中 页 中 所 有 的 存储 单元 都 变 成 了 逻辑 状态 “0”， 那 么 融 停 止 执行 部 分 页 重 编程 操作 ， 并 将 PPNum 置 为 0， 以 此 避免 对 此 页 造成 完整 的 Scrubbing 操 
作 。 


(2) 部 分 块 擦 除 


类 似 的 ， 部 分 块 擦 除 操作 利用 的 也 是 NAND Flash 特 殊 的 物理 性 质 : 由 于 制造 过 程 的 差异 性 ， 各 个 存储 单元 的 擦 除 操作 的 立 值 电压 不 一 样 ， 即 每 个 存储 单 
元 在 擦 除 操作 前 的 电压 和 擦 除 操作 后 的 电压 是 不 一 样 的 。 


在 每 一 个 NAND Flash 心 片 的 数据 手册 中 ， 有 一 个 参数 称 为 块 擦 除 时 | 间 (tBERS) ， 这 个 参数 是 指 在 擦 除 过 程 (放电 ) 中 ， 一 个 块 中 所 有 存储 单元 从 逻辑 
状态 “0” 变 成 逻辑 状态 “1” 所 需要 的 时 间 。 如 果 缩 短 对 一 个 块 中 人 存储 单元 的 探 除 时 间 ， 融 会 造成 只 有 一 部 分 人 存储 单元 完成 放电 ， 从 逻辑 状态 “0” 变 成 逻辑 
状态 “1”， 而 其 他 存储 单元 仍 会 保持 逻辑 状态 “0”。 


一 个 部 分 块 擦 除 操 作 是 指 在 一 个 已 被 写 入 数据 的 块 中 ， 进 行 一 次 或 多 次 (PENum) 部 分 探 除 操作 ， 即 探 除 操作 只 持续 一 段 缩短 的 时 间 (te) 的 操作 ， 使 
得 该 块 中 的 只 有 部 分 数据 被 改变 ， 即 只 有 一 部 分 处 于 逻辑 状态 “0” 的 存储 单元 变 成 逻辑 状态 “1”， 而 其 他 存储 单元 保持 其 原 有 的 逻辑 状态 不 变 。 


利用 部 分 块 擦 除 操作 来 实现 一 块 数 据 的 删除 ， 需 要 先 确 定 部 分 块 擦 除 的 次 数 (PPNum) 和 每 次 部 分 块 擦 除 的 执行 时 间 (te) 。 步 又 如 下 : 


1) 将 te 初始 化 为 一 个 较 小 值 (如 1hs) 。 


2) 根据 图 8-8 中 算法 计算 出 对 应 的 PENum。 

3) te 按照 一 定 的 增 量 递增 ， 并 分 别 计 算出 对 应 的 PENum ， 当 te 增加 到 大 于 tBERS 或 者 计算 出 对 应 的 PENum 为 0 时 停止 。 

4) 选择 texPENum 最 小 的 一 组 (排除 PENum 为 0 的 情况 ) ， 作 为 目标 NAND Flash 心 请 的 部 分 块 控 除 操作 的 次 数 和 每 次 执行 时 间 。 
接 下 来 介绍 图 8-8 中 由 一 个 确定 的 te 来 确定 PENum 的 过 程 。 


首先 ， 擦 除 一 个 随机 选择 的 块 (BlockNum) ， 将 此 块 中 的 所 有 页 写 满 随机 数 ， 并 将 各 页 数据 读 出 (PreNum) 。 然 后 ， 利 用 确定 的 te 对 选中 的 块 进行 一 
次 部 分 块 探 除 操作 。 部 分 块 探 除 操作 执行 结束 后 ， 在 选中 的 块 中 部 分 存储 单元 会 由 于 放电 成 功 而 友 生 位 翻转 现象 ， 即 由 逻辑 状态 “0” 变 成 逻辑 状态 “1”。 再 
次 读 选 中 页 的 数据 ， 并 与 PreNum 逐 字 世 进行 比较 。 接 下 来 ， 在 选中 的 块 中 再 次 执行 部 分 块 擦 除 操作 ， 并 记录 部 分 块 擦 除 操作 的 执行 次 数 PENum ， 直 到 观察 
到 所 有 的 非 全 1 字 节 中 都 全 少 有 1 个 仓储 单元 友 生 了 位 翻转 现象 。 注 意 ， 如 果 在 选中 块 中 执行 部 分 块 探 除 操作 的 过 程 中 ， 观 察 到 所 有 的 存储 单元 都 变 成 了 逻辑 状 
态 “1”， 那 么 就 停止 执行 部 分 块 擦 除 操作 ， 并 将 PENum 置 为 0， 以 此 避免 对 此 块 造 成 一 次 完整 的 块 擦 除 操作 。 


算法 ”确定 每 钛 执行 部 分 其 探 除 时 间 上 ， 求 得 对 应 的 部 分 块 探 除 操 作 次 数 PENum 
Require: 

BlockNum: 随机 选择 的 一 个 物理 块 号 ， 

上 : 每 次 执行 部 分 块 探 除 时 间 。 

上 nsure : 

PENum: 傅 定 的 部 分 其 探 除 时 间 所 对 应 的 部 分 其 探 除 操 作 放 数 。 

PENum = 0: 

Erase the block identified by BlockNum: 


Write random information to the selected block: 


~ 


一 一 一 
[ 


Store the data of the selected block to PreNum: 

Fiag = 0; 

while Flag ==0 do 
Preform a PBE operation on the selected block based ont.: 
++PENum: 
Compare the data in the selected block with PreNum in bytes: 


2: 
3: 
4: 
3: 
0: 
fs 
8: 
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OY 


if At least one bit flips in each non-all-one byte then 
Flag = 1; 
if All! the bits have turned to “1 then 
PENum = 0: 
end if 
end if 


end while 
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图 8-8 ”由 一 个 确定 的 te 来 确定 PENum 的 过 程 
(3) 将 部 分 Scrubbing 操 作 加 入 FTL 中 
接 下 来 就 需要 将 部 分 Scrubbing 操 作 加 入 到 FTL 中 ， 实 现 安全 的 不 可 检测 的 数据 删除 。 


通常 来 讲 ，FTL 向 上 层 (如 文件 系统 层 ) 提供 了 两 个 访问 接口 ， 一 个 是 读 操 作 ， 另 外 一 个 是 写 操 作 。 删 除 操作 可 以 看 作 一 种 特殊 的 写 操 作 (比如 TRIM 命 
， 融 是 将 数据 清空 写 0。 由 于 读 操作 不 会 造成 数据 的 删除 ， 所 以 只 需要 在 FTL 中 修改 写 操作 的 逻辑 。 


由 于 NAND Flash 非 原 位 更 新 的 特点 ， 传 统 的 FTL 机 制 在 执行 数据 删除 /更 新 操作 时 ， 只 是 通过 更 新 地 址 映射 将 仔 有 目标 删除 数据 的 所 在 数据 页 标记 为 “ 删 
除 ”， 而 将 新 数据 写 入 新 的 数据 页 中 ， 直 到 触 上 友 垃 圾 回收 机 制 后 才 会 将 目标 删除 数据 所 在 的 物理 数据 页 进行 回收 ， 实 现 真正 的 探 除 目标 删 除数 据 。 为 了 实现 及 
时 的 数据 安全 删除 ， 减 小 敌手 攻击 的 时 间 窗 口 ， 需 要 在 产生 无 用 数据 ， 即 产生 目标 删除 数据 时 ， 立 即 对 目标 数据 所 在 的 位 置 进行 部 分 Scrubbing 操 作 。 


接 下 来 介绍 如 何 将 部 分 Scrubbing 操 作 分 别 加 入 到 典型 的 FTL 机 制 中 ， 即 页 级 映射 FTL、 块 级 映射 FTL 以 及 混合 映射 FTL。 
. 页 级 映射 FTL 


在 页 级 映射 FTL 中 ， 逻 辑 页 与 物理 页 一 一 对 应 ， 每 一 个 逻辑 页 号 对 应 一 个 NAND Flash 中 的 物理 页 号 。 当 一 个 物理 页 数据 变 为 无 用 数据 后 ， 需 要 对 此 物理 
页 立即 执行 部 分 Scrubbing 操 作 。 图 8-9 中 的 算法 解释 了 如 何 将 部 分 Scrubbing 操 作 加 入 到 页 级 映射 FTL 的 写 操作 过 程 中 。 


算法 ”将 部 分 Scrubbing 操作 加 入 到 页 级 映射 FTL 的 写 操作 中 


Require: 

LP4ddr: 目标 逻辑 页 号 ; Bu1jfe: 写 请 求 的 内 容 。 

Ensure: 

部 分 删除 无 效 的 物理 页 中 内 容 。 

1: Find out the physical pagel(i.e.,PPAddr) associated with LPAddr. 


if PPAddr |! = NULL then 

Perform PPR on the physical page PPAddr: 
end if 
if Buffer |! = NULL then 

Write the Buffer to a new physical page: 
end if 
Update the page mapping for LPAddr: 





图 8-9 ”将 部 分 Scrubbing 操 作 加 入 到 页 级 映射 FIL 的 写 操作 中 


页 级 映射 FTL 不 断 地 接收 由 上 层 传 递 下 来 的 写 请 求 操作 ， 假 设 写 请 求 的 目标 逻辑 地 址 是 LPAddr， 写 请 求 的 内 容 是 Buffer， 即 代表 需要 将 Buffer 写 入 逻辑 地 
址 为 LPAddr 对 应 的 物理 NAND Flash 页 中 。 首 先 ， 根 据 页 级 地 址 映射 表 ， 碍 找到 逻辑 地 址 L[PAddr 所 对 应 的 物理 页 (PPAddr) 。 如 果 PPAddr 不 为 空 ， 则 需要 
在 物理 页 PPAddr 中 执行 部 分 页 重 编程 操作 ， 即 对 物理 页 PPAddr 执 行 PPNum 次 部 分 编程 操作 ， 每 次 部 分 编程 操作 持续 tp 时 间 ， 保 证 将 物理 页 PPAddr 中 的 数 
据 删 除 ， 同 时 保证 不 会 产生 全 “0” 页 。 


若 写 请 求 的 Buffer 不 为 空 时 ， 即 该 请 求 是 一 个 真正 的 写 请 求 ， 则 将 Buffer 写 入 一 个 新 的 空间 物理 页 中 ， 然 后 更 新 页 级 地 址 映射 表 ， 将 逻辑 地 址 LPAddr 对 
应 的 物理 页 更 新 为 新 写 入 数据 的 物理 页 ， 若 该 请 求 是 一 个 删除 操作 ， 则 只 需 在 页 级 地 址 映射 表 中 删除 逻辑 地 址 LPAddr 所 对 应 的 映射 信息 。 


` 块 级 映射 FTL 


在 块 级 映射 FTL 中 ， 地 址 映射 的 基本 单位 是 块 ， 一 个 逻辑 页 在 逻辑 块 中 的 偏 移 与 在 其 对 应 的 物理 块 中 的 偏 移 是 一 致 的 。 当 一 个 物理 页 数据 变 为 无 用 数据 
后 ， 需 要 对 此 物理 页 所 在 的 块 立即 执行 部 分 Scrubbing 操 作 。 图 8-10 中 的 算法 解释 了 如 何 将 部 分 Scrubbing 操 作 加 入 到 块 级 映射 FTL 的 写 操作 过 程 中 。 





算法 ”将 部 分 Scrubbing 操作 加 入 到 块 级 映射 FTL 的 写 操 作 中 


Require: 
LP4ddr: 目标 人 逻辑 页 号 ; Buffer: 写 请 求 的 内 容 。 
Ensure: 


部 分 删除 无 效 的 物理 页 / 物理 块 中 的 内 容 。 
1: Obtain the logical block(i.e.,LBAddr) for logical page LPAddr: 


2: Obtain the location(i.e.,OF Fset) of LPAddr in LBAddr: 

3: Find out the physical block(i.e., PBAddr) associated with LBAddr.: 

4: if PBAddr != NULL then 

$s: if The OFFset page of PBAddr != NULL then 

0: Copy the valid pages of PBAddr to their corresponding locations of a new physical block: 
7: if Buffer!= NULL then 

8: Write the data from Buffer to the OF Fset page of the new physical block: 
9: end 让 

10: Update the mapping for LBAddr.: 

11: Perform PBE on the physical blokc PBAddr: 

12: else 

133 if Bufferl= NULL then 

14: Write the data from Buffer to the OF Fset page of PBAddr.: 

lS: end if 

16: endif 

17: else 


18: if Buffer! = NULL then 


19: Write the Buffer to the OF Fset page of a new physical blokc: 
20: endif 

21: Update the mapping for LBAddr: 

22: end if 


图 8-10 ”将 部 分 Scrubbing 操 作 加 入 到 块 级 映射 FIL 的 写 操 作 过 程 中 


块 级 映射 FTL 不 断 接收 由 上 层 传 递 下 来 的 写 请 求 操作 ， 同 样 假设 写 请 求 的 目标 逻辑 地 址 是 LPAddr， 写 请 求 的 内 容 是 Buffer， 即 代表 需要 将 Buffer 写 入 逻辑 
地 址 为 LPAddr 对 应 的 物理 NAND Flash 页 中 。 首 先 ， 计 算 逻 辑 地 址 LPAddr 所 在 的 钦 辑 块 号 (LBAddr) 及 其 在 该 块 内 的 偏 移 量 (OFFset) 。 根 据 块 级 地 址 映 
射 表 ， 查 找到 逻辑 块 LBAddr 所 对 应 的 物理 块 号 (PBAddr) 。 


如 果 物 理 块 号 PBAddr 不 为 空 ， 并 且 该 块 内 的 OFFset 页 已 被 写 入 数据 ， 则 需要 先 将 该 块 内 的 有 效 的 物理 页 中 的 数据 复制 到 一 个 新 的 物理 块 中 ， 并 保持 各 有 
效 页 在 新 物理 块 中 的 侦 移 量 不 变 。 各 写 请 求 的 Buffer 不 为 空 时 ， 即 该 请 求 是 一 个 真正 的 写 请 求 ， 则 将 Buffer 写 入 新 分 配 的 物理 块 中 对 应 的 OFFset 页 中 。 更 新 块 
级 地 址 映射 表 ， 将 逻辑 块 LBAddr 所 对 应 的 物理 块 号 更 新 为 新 分 配 的 物理 块 。 最 后 在 物理 块 PBAddr 中 执行 部 分 块 探 除 操作 ， 即 对 物理 块 PBAddr 执 行 PENum 次 
部 分 擦 除 操 作 ， 每 次 部 分 擦 除 操作 持续 te 时 间 ， 保 证 将 物理 块 PBAddr 中 的 数据 删除 ， 同 时 保证 不 会 产生 全 “1” 块 。 


如 果 物 理 块 号 PBAddr 不 为 宇 ， 且 该 块 内 的 OFFset 页 未 被 写 入 数据 ， 当 写 请 求 的 Buffer 不 为 空 时 ， 即 该 请 求 是 一 个 真正 的 写 请 求 ， 则 只 需要 将 Buffer 写 入 
物理 块 PBAddr 对 应 的 OFFset 页 中 。 


各 根据 块 级 地 址 映射 表 ， 碍 找到 的 逻辑 块 L[BAddr 所 对 应 的 物理 块 号 (PBAddr) 为 空 ， 且 该 写 请 求 的 Buffer 不 为 空 时 ， 即 该 请 求 是 一 个 真正 的 写 请 求 ， 则 
只 需要 新 分 配 一 个 物理 块 ， 并 将 Buffer 写 入 该 块 的 OFFset 页 中 ， 并 更 新 块 级 地 址 映射 表 中 逻辑 块 LBAddr 所 对 应 的 物理 块 号 。 


混合 映射 FTL 


在 混合 映射 FTL 中 ， 同 时 使 用 页 级 映射 和 块 级 映射 。 当 一 个 物理 页 或 者 物理 块 中 的 数据 变 为 无 用 数据 后 ， 需 要 对 此 物理 页 或 者 物理 块 立即 执行 部 分 


Scrubbing 操 作 。 图 8-11 中 的 算法 解释 了 如 何 将 部 分 Scrubbing 操 作 加 入 到 混合 映射 FTL 的 写 操作 过 程 中 。 


混合 映射 FTL 不 断 接收 由 上 层 传 递 下 来 的 写 请 求 操作 ， 同 样 假设 写 请 求 的 目标 逻辑 地 址 是 LPAddr， 写 请 求 的 内 容 是 Buffer， 即 代表 需要 将 Buffer 写 入 逻辑 
地 址 为 LPAddr 对 应 的 物理 NAND Flash 页 中 。 


首先 ， 计 算 逻 辑 地 址 LPAddr 所 在 的 逻辑 块 号 (LBAddr) 及 其 在 该 块 内 的 偏 移 量 (OFFset) 。 根 据 块 级 地 址 映射 表 ， 碍 找到 逻辑 块 L[BAddr 所 对 应 的 物理 
块 号 (PBAddr) 。 


如 果 物 理 块 号 PBAddr 不 为 空 ， 则 再 根据 页 级 地 址 映射 表 ， 查 找 逻 辑 地 址 LPAddr 对 应 的 物理 页 号 (PPAddr) 。 如 果 物 理 页 号 PPAddr 不 为 空 ， 表 示 该 页 中 
已 有 数据 ， 且 写 请 求 的 Buffer 不 为 空 时 ( 即 该 请 求 是 一 个 真正 的 写 请 求 ) ， 则 应 将 Buffer 写 入 物理 块 号 PBAddr 所 对 应 的 日 志 块 中 。 若 物理 块 号 PBAddr 所 对 应 
的 日 志 块 中 含有 空 几 页 ， 则 直接 将 Buffer 写 入 一 个 空 几 页 中 ， 用 该 空 闪 页 更 新 页 级 地 址 映射 表 中 人 逻辑 地 址 LPAddr 的 映射 ， 并 对 物理 页 PPAddr 执 行 部 分 页 重 编 
程 操 作 ， 即 对 物理 页 PPAddr 执 行 PPNum 次 部 分 编程 操作 ， 每 次 部 分 编程 操作 持续 tp 时 间 ， 保 证 将 物理 页 PPAddr 中 的 数据 删除 ， 同 时 保证 不 会 产生 
全 “0” 页 ; 名 物理 块 号 PBAddr 所 对 应 的 日 志 块 中 没有 空 亲 页 ， 则 需要 对 该 日 志 块 与 其 对 应 的 各 个 数据 块 进行 合并 操作 ， 将 Buffer 写 入 新 的 数据 块 中 的 
OFFset 页 中 。 更 新 块 级 地 址 映射 表 ， 并 在 执行 完 合并 操作 的 日 志 块 与 数据 块 中 执行 部 分 块 探 除 操作 ， 即 对 各 个 块 分 别 执行 PENum 次 部 分 探 除 操作 ， 每 次 部 分 
探 除 操作 持续 te 时 间 ， 保 证 将 各 个 块 中 的 数据 删除 ， 同 时 保证 不 会 产生 全 “1” 块 。 


如 果 物 理 块 号 PBAddr 为 空 ， 则 需 分 配 一 个 新 的 物理 块 。 当 写 请 求 的 Buffer 不 为 空 时 ， 将 Buffer 写 入 新 的 数据 块 的 OFFset 页 中 ， 并 更 新 块 级 地 址 映射 表 。 





算法 “将 部 分 Scrubbing 操作 加 入 到 混合 映射 FTL 的 写 操作 中 


Require: 
LP4ddr: 目标 逻辑 页 号 ; Buffer: 写 请 求 的 内 容 。 
Ensure: 


部 分 删除 无 效 的 物理 页 / 物理 块 中 的 内 容 。 

1: Obtain the logical block (i.e.,LBAddr) for logical page LPAddr. 
2: Opbtain the location (i.e.OFFset) Of LPAddr in LBAddr: 

3: Find out the physical block (i.e.PBAddr) associated with LBAddr.: 
4: if PBAddr != NULL then 

$: Find out the physical page (i.e.PBAddr) associated with LPAddr.: 
6: if PPAddr!'=NULL then 

1 if There is a free page in the log block then 

8 if Buffer!= NULL then 

9: Writer the data from Buffer to the current log block: 

10: end if 

11: Update the page mapping for LPAddr. 

ly Perform PPR on PP4ddr: 

13: else 

14: Merge the log block and its data blocks: 

13:; if Bufferl= NULL then 

16: Write the Buffer to the OF Ffset page of the new data block;: 
17: end if 

1 8: Update the block mapping table: 

19: Perform PBE on the associated log block and data blocks; 
20: end if 

21: else 

22: if Bufferl= NULL then 

过 Write the Buffer to the OF Fset page of PBAddr: 


24: end 让 
a end if 
20: else 


27: if Buffer!l= NULL then 
28: Writer the Buffer to the OF Fset page of a new data block: 


29: end 让 
30: Update the block mapping for LBAddr: 
31: end if 


图 8-11 将 部 分 Scrubbing 操 作 加 入 到 混合 映射 FIL 的 写 操 作 过 程 中 
(4) 消除 其 他 可 能 泄露 删除 历史 的 因素 


部 分 Scrubbing 操 作 通过 改变 部 分 目标 删除 数据 ， 使 数据 无 法 恢复 ， 且 保证 敌手 无 法 直接 从 NAND Flash 的 数据 中 上 友 现 删除 数据 的 痕迹 。 但 是 仍然 存在 一 
些 系统 元 数据 可 能 泄露 删除 数据 的 痕迹 ， 比 如 映射 表 和 纠 错 码 (ECC) 。 


` 映射 表 


由 于 NAND Flash 非 原 位 更 新 的 性 质 ， 存 储 于 NAND Flash 中 的 有 效 数 据 的 位 置 随 着 更 新 、 删 除 操 作 而 不 断 变 化 ， 因 此 需要 在 NAND Flash 中 维护 、 保 存 


上 层 逻 辑 地 址 与 NAND Flash 中 物理 位 置 的 映射 表 。 由 于 映射 表 中 没有 保存 过 时 数据 的 映射 关系 ， 因 此 敌手 可 能 通过 分 析 映 射 表 识别 出 有 效 数 据 和 过 时 数据 。 
注意 ， 过 时 数据 即 需要 使 用 部 分 Scrubbing 操 作 来 安全 删除 的 数据 。 


为 了 避免 上 述 情况 ， 需 要 对 映射 表 加 密 后 人 存储， 其 加 密 密 钥 可 以 来 源 于 用 户 的 口令 。 具 体 来 讲 ， 用 户 在 局 动 NAND Flash 和 存储 设备 时 ， 输 入 用 户口 令 ， 
成 加 密 密 钥 ， 然 后 用 加 密 密 钥 解 密 映 射 表 。 弛 载 NAND Flash 存 储 设备 时 ， 保 证 用 户口 令 、 加 密 密 铀 、 解 密 后 的 映射 表 从 内 存 (SRAM 和 DRAM) 中 删除 ， 以 
此 保证 映射 表 的 安全 性 ， 从 而 避免 敌手 通过 映射 表 来 获得 删除 数据 的 痕迹 。 


. 纠 错 码 (ECC) 


NAND Flash 和 存储 密度 的 增加 ， 以 及 NAND Flash 各 个 块 的 擦 写 次 数 的 增加 ， 都 会 增 大 存储 数据 的 位 错误 率 。 因 此 ， 为 了 保证 存储 数据 的 可 靠 性 ,NAND 
Flash 每 一 页 的 OOB 区 中 都 会 保存 该 页 的 纠 错 码 。 


部 分 Scrubbing 操 作 通 过 修改 目标 删除 页 的 部 分 位 数据 来 达到 删除 数据 的 同时 ， 保 障 政 手 无 法 友 现 删除 痕迹 ， 从 而 实现 不 可 检测 的 数据 安全 删除 方案 。 但 
是 ,部 分 Scrubbing 操 作 无 法 修改 、 更 新 目标 删除 页 对 应 的 纠 错 码 ， 因 为 必须 在 该 页 所 在 的 块 被 擦 除 后 才能 通过 写 操 作 修 改 该 页 的 纠 错 码 。 由 于 执行 过 部 分 
scrubbing 操 作 的 页 的 内 容 与 其 纠 错 码 的 对 应 关系 已 经 被 破坏 ， 因 此 敌手 可 能 通过 校 验 各 个 数据 页 的 内 容 与 纠 错 码 识别 出 曾 执行 过 部 分 Scrubbing 操 作 的 页 。 


为 了 避免 上 述 情 况 的 友 生 ， 可 将 每 一 个 数据 页 的 纠 错 码 异 或 一 个 数值 后 存储 。 举 例 来 说 ， 假 设 一 个 页 的 纠 错 码 是 P， 在 该 员 OOB 区 中 存储 的 纠 错 码 是 P', 
其 中 P =P@Fkey (PagelD) 。F 是 一 个 伪 随 机 消 数 ，PagelD 是 该 页 的 物理 页 号 ， 密 钥 key 可 以 从 用 户 输 入 的 口令 生成 。 由 于 政 手 无 法 获得 密 钥 key， 因 此 政 手 
无 法 通过 判断 每 一 页 的 内 容 与 其 纠 错 码 的 对 应 关系 来 获得 删除 页 的 痕迹 。 


4. 实 验 
在 对 NFPS 机 制 进行 性 能 评估 之 前 ， 需 要 对 部 分 gcrubbing 操 作 进行 可 靠 性 评估 。 
(1) 可 靠 性 


为 了 检测 部 分 Scrubbing 操 作对 NAND Flash 忌 片 的 影响 ，Jia 等 人 使 用 了 具备 STM32F103VCT6 控 制 器 的 开发 板 对 NAND Flash 芯 片 进行 了 测试 。 利 用 这 
个 控制 器 可 以 向 目标 芯片 发 送 读 、 编 程 和 按 除 命令 。Jjia 等 人 对 表 8-1 中 的 NAND Flash 蕊 片 进 行 了 测试 ， 这 些 芯 片 来 自 于 6 个 生产 厂家 ， 涵 盖 了 SLC 型 和 MLC 型 
多 多 种 容量 的 NAND Flash 世 片 。 


表 8-1 测试 的 NAND Flash 芯 片 
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为 了 评估 部 分 页 重 编程 操作 对 测试 NAND Flash 心 片 中 数据 导致 的 位 错误 影响 ， 需 要 首先 获得 每 一 个 心 片 的 部 分 页 重 编程 的 操作 次 数 (PPNum) 和 每 次 
部 分 页 重 编程 的 执行 时 间 (tp) 。 如 表 8-2 中 的 前 3 列 所 示 ， 每 个 心 片 的 部 分 页 重 编程 的 操作 时 间 (tpxPPNum) 约 为 页 编程 时 间 (tPROG) 的 3/10。 


表 8-2 测试 芯片 的 对 应 操作 所 选取 的 系数 
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确定 了 测试 NAND Flash 心 片 部 分 页 重 编程 的 操作 次 数 (PPNum) 和 每 次 部 分 页 重 编程 的 执行 时 间 (tp) 后 ， 接 下 来 整 需 要 测试 各 个 心 片 在 部 分 页 重 编 
程 操作 下 的 可 靠 性 。 


首先 ， 擦 除 一 个 随机 选择 的 块 ， 并 在 此 块 中 写 满 随机 数 。 然 后 随机 选择 此 块 中 的 一 页 ， 对 此 页 进行 部 分 页 重 编程 操作 。 每 一 次 部 分 页 重 编程 操作 执行 完成 
之 后 ， 检 查 该 块 中 每 一 页 中 的 数据 是 否 友 生 了 改变 ， 即 是 否 及 生 了 位 翻转 现象 。 对 每 一 个 心 片 ， 随 机 选择 100 个 块 ， 重 复 100 次 实验 。 


对 于 SLC 型 的 NAND Flash 心 片 ， 部 分 页 重 编程 操作 没有 对 数据 造成 任何 影响 。 而 对 于 MLC 型 的 NAND Flash 心 片 ， 却 有 不 同 的 结果 。 每 一 个 MLC 心 片 的 
存储 单元 中 存储 着 2 位 的 数据 ， 并 且 这 2 位 数据 属于 不 同 的 物理 页 ， 所 以 对 一 页 进行 部 分 页 重 编程 操作 总 是 会 对 另外 一 页 造成 较 大 影响 ， 但 幸运 的 是 一 个 存储 单 
元 中 的 2 位 数据 所 在 的 物理 页 位 置 关 系 是 确定 的 。 


具体 来 说 ， 如 图 8-12 中 MLC 型 NAND Flash 心 片 中 存储 单元 与 物理 页 位 置 的 对 应 天 系 : 对 于 All-Bit line (全 位 线 ) 模式 的 MLC 忆 片 ， 对 物理 页 2n- 
1 (n>0) 进行 部 分 页 重 编程 操作 ， 总 是 会 干扰 到 2n+2 页 中 的 数据 ; 对 于 Even-Odd-Bit line (奇偶 位 线 ) 模式 的 MLC 忌 片 ， 对 物理 页 4n-1 和 4n-2 (n>0) 进 
行 部 分 页 重 编程 操作 ， 总 是 会 干扰 到 4n+5、4n+4 页 中 的 数据 。 
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图 8-12 ”MLC 型 芯片 存储 单元 与 物理 页 位 置 的 对 应 关系 


因此 ， 在 MLC 型 NAND Flash 心 片 中 执行 部 分 页 重 编程 操作 时 ， 需 要 将 目标 删除 页 所 关联 的 非 目标 页 中 的 有 效 数据 复制 到 其 他 页 中 ， 并 对 两 个 页 都 执行 部 
分 页 重 编程 操作 。 图 8-13 显 示 的 是 部 分 页 重 编程 操作 对 MLC 必 片 的 影响 ， 横 轴 表 示 在 一 个 块 中 执行 部 分 页 重 编程 操作 的 次 数 ， 纵 轴 表 示 (排除 天 联 页 后 ) 数 
据 的 位 错误 率 (BER) 。 通 过 实验 友 现 ， 在 5 种 测试 的 MLC 型 心 片 中， 在 3 种 心 片 中 友 现 了 对 同一 块 中 其 他 页 造成 位 错误 的 现象 。 具 体 地 说 ,， 心 片 H (60nm) 
和 心 请 | (90nm) 没有 发 现 对 同一 块 中 其 他 页 造成 位 错误 的 现象 ， 而 在 心 请 G (51nm) 中 对 一 个 块 中 进行 50 次 部 分 页 重 编程 操作 后 ， 会 造成 同一 块 中 其 他 页 
位 错误 。 心 请 E 和 心 请 F (34nm) ， 在 对 一 个 块 中 进行 16 ~ 30 次 部 分 页 重 编程 操作 后 ， 会 造成 同一 块 中 其 他 页 位 错误 。 实 验 表 明 ， 部 分 页 重 编程 操作 对 密度 较 
高 的 MLC 型 心 睛 造成 的 影响 较 大 ， 所 以 在 一 个 MLC 型 必 片 中 使 用 部 分 页 重 编程 操作 进行 数据 删除 时 ， 在 对 其 他 页 产生 影响 前 ， 需 要 将 该 块 中 的 数据 移动 到 其 
他 块 中 ， 并 在 该 块 中 执行 部 分 探 除 操作 。 
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图 8-13 ”部 分 页 重 编 程 操作 对 MLC 芯片 的 影响 帆 


` 部 分 块 擦 除 (PBE) 

为 了 评估 部 分 块 擦 除 操作 对 测试 NAND Flash 心 片 中 数据 导致 的 位 错误 影响 ,需要 首先 获得 每 一 个 心 片 的 部 分 块 擦 除 的 操作 次 数 (PENum) 和 每 次 部 分 
块 擦 除 操 作 的 执行 时 间 (te) 。 如 表 8-2 中 的 后 3 列 所 示 ， 每 个 心 片 的 部 分 块 擦 除 的 操作 时 间 (texPENum) 约 为 块 探 除 时 间 (tBERS) 的 1/10， 且 部 分 块 擦 除 
的 操作 次 数 思 为 1。 

确定 了 测试 NAND Flash 心 片 部 分 块 擦 除 的 操作 次 数 (PENum) 和 每 次 部 分 块 控 除 的 执行 时 间 (te) 后 ， 接 下 来 就 需要 测试 各 个 心 片 在 部 分 块 擦 除 操作 下 
的 可 靠 性 。 首 先 ， 擦 除 3 个 随机 选择 的 相 邻 物理 块 ， 并 在 这 3 个 块 中 写 满 随机 数 。 然 后 ， 在 中 间 块 中 执行 部 分 块 擦 除 操作 ， 每 一 次 部 分 块 擦 除 执行 完成 之 后 ， 检 
查 其 他 两 块 中 每 一 页 中 的 数据 是 否 友 生 了 改变 ， 即 是 否 故 生 了 位 翻转 现象 。 对 每 一 个 心 片 随机 选择 150 个 块 ， 重 复 50 次 实验 。 

实验 表明 ， 对 于 SLC 型 和 MLC 型 的 NAND Flash 心 上 请， 部 分 块 擦 除 操作 没有 对 数据 造成 任何 影响 ， 造 成 这 种 现象 的 原因 是 NAND Flash 心 片 的 各 个 块 之 间 
是 物理 独立 的 。 


(2) 性 能 评估 


NFPS 机 制 利 用 部 分 Scrubbing 操 作对 数据 实现 不 可 检测 的 删除 ， 部 分 Scrubbing 操 作 只 是 修改 了 FTL 中 编程 操作 的 过 程 ， 并 没有 增加 NAND Flash 心 片 的 
编程 擦 除 操作 次 数 ， 而 且 也 没有 对 垃圾 回收 和 使 用 均衡 操作 造成 影响 ， 因 此 NFPS 机 制 对 NAND Flash 心 片 的 使 用 寿命 的 影响 较 小 。 


. SLC 型 芯片 


为 了 测试 NFPS 机 制 对 SLC 型 NAND Flash 芯 片 的 影响 ，Jia 等 人 采用 了 OpenNFM 平 台 ， 这 是 一 个 开源 的 NAND Flash 控 制 器 平台 。OpenNFM 自 带 的 FTL 
采用 的 是 页 级 映射 ，Jia 等 人 在 OpenNFM 自 市 的 FTL 中 增加 了 NFPS 机 制 。Jia 等 人 又 将 OpenNFM 自 市 的 FTL 修 改 成 了 另外 其 他 两 个 版 本 : 块 级 映射 FTL 和 FAST 
混合 映射 FTL (因为 FAST 混 合 映射 相 较 于 其 他 混合 映射 机 制 有 着 较 高 的 读 写 性 能 ) ， 并 在 修改 完成 的 版 本 中 加 入 了 相应 的 NFPS 机 制 。Jia 等 人 将 修改 好 的 FTL 
机 制 移植 天 了 OpenNFM 平 台 自 带 的 开 友 板 上 ， 这 个 开发 板 上 配置 的 是 表 8-1 中 的 心 片 C (SLC 型 ) ， 并 利用 FIO 工 具 来 测试 具体 的 读 写 性 能 。 


图 8-14 中 对 比 了 三 种 加 入 NFPS 机 制 的 FTL 与 原始 FTL 机 制 在 SLC 型 芯片 上 的 写 性 能 (RW 表示 随机 写 ，SW 表 示 顺序 写 )。 模 轴 表 示 的 是 测试 NAND Flash 
芯片 容量 的 使 用 比例 ， 纵 轴 表 示 的 是 写 速度 (KB/s) 。 通 过 图 中 数据 可 知 ， 加 入 NFPS 机 制 的 块 级 映射 FTL 写 性 能 下 降 得 最 大 ， 这 是 由 于 在 块 级 映射 FTL 中 需要 
执行 频繁 的 块 合并 操作 ， 对 有 效 页 进行 频繁 的 复制 操作 ， 并 且 部 分 块 擦 除 操作 的 执行 时 间 相 对 部 分 页 编程 操作 时 间 较 长 。 加 入 NFPS 机 制 的 FAST 混 合 映射 FTL 
的 写 性 能 下 降 了 50% 左 右 ， 这 是 因为 混合 映射 FTL 需 要 对 数据 块 和 日 志 块 进行 合并 ， 从 而 增加 了 系统 消耗 。 加 入 NFPS 机 制 的 页 级 映射 FTL 写 性 能 下 降 为 原来 的 
62% 左 右 。 


. MLC 型 芯片 


为 了 测试 NFPS 机 制 对 MLC 型 NAND Flash 心 片 的 影响 ，Jia 等 人 将 NFPS 机 制 移植 到 了 一 个 FTL 模 拟 器 中 ， 并 在 MLC 型 心 片 E (34nm) 中 进行 了 性 能 测 
试 。 


-~*- OpenNFM-SW —e— OpenNFM-RW 
-~*- NFPS-SW —e— NFPS-RW 





NAND Flash 世 片 使 用 比例 
a) 页 级 映射 FTL 
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b) 块 级 映射 FTL 


-上 米 - OpenNFM-SW 一 e 一 OpenNFM-RW 
-~*- NFPS-SW —e— NFPS-RW 
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c) FAST 混 合 上 映射 FTL 


图 8-14 ”加 入 NFPS 机 制 的 FTL 与 原始 FIL 机 制 在 SLC 型 芯片 上 的 写 性 能 对 比 


图 8-15 中 对 比 了 三 种 加 入 NFPS 机 制 的 FTL 与 原始 FTL 机 制 在 MLC 型 心 刻 上 的 写 性 能 (RW 表示 随机 写 ，SW 表 示 顺 序 写 ) 。 横 轴 表 示 的 是 测试 NAND Flash 
心 片 容 量 的 使 用 比例 ， 纵 轴 表 示 的 是 写 速 度 (KB/s) 。 由 于 在 最 差 情况 下 ， 在 心 片 E 中 执行 16 次 部 分 页 重 编程 操作 后 会 对 其 他 页 的 数据 造成 影响 ， 所 以 在 一 个 
块 中 执行 16 次 部 分 页 重 编程 操作 之 前 ， 需 要 将 该 块 中 的 有 效 数 据 复制 到 其 他 空 闪 块 中 。 通 过 图 中 数据 可 知 ， 加 入 NFPS 机 制 的 块 级 映射 FTL 写 性 能 下 降 得 最 
少 ， 这 是 由 于 在 块 级 映射 FTL 中 ， 当 需要 删除 数据 时 ， 将 有 效 数据 复制 到 其 他 空闲 块 中 后 ， 只 需要 执行 一 次 部 分 块 探 除 操作 。 而 在 加 入 NFPS 机 制 的 FAsT 混 合 
映射 FTL 中 和 加 入 NFPs 机 制 的 页 级 映射 FTL 中 ， 需 要 先 将 目标 删除 页 的 关联 页 复制 到 其 他 空 亲 页 中 。 并 且 ， 在 加 入 NFPs 机 制 的 FAsT 混 合 映射 FTL 中 ， 当 日 志 
块 中 的 页 用 完 时 ， 需 要 对 数据 块 和 日 志 块 进行 合并 ， 从 而 增加 了 系统 消耗 。 
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a) 页 级 映射 FTL 
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NAND Flash 芯 片 使 用 比例 
b) 块 级 映射 FTL 
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c) FAST 混 合 映射 FTL 


图 8-15 ”加 入 NEFPS 机 制 的 FIL 与 原始 FTL 机 制 在 MLC 型 芯片 上 的 写 性 能 对 比 
Jia 等 人 提出 的 NFPs 机 制 ， 通 过 在 FTL 中 加 入 部 分 页 编程 和 部 分 块 擦 除 技术 ， 使 得 能 够 快速 删除 目标 数据 ， 并 且 保 证 不 会 在 NAND Flash 中 产生 数据 删除 的 
痕迹 ， 从 而 使 得 政 手 不 能 恢复 数据 ， 也 不 能 从 相 邻 数据 中 获得 删除 数据 的 信息 ， 实 现 了 不 可 检测 的 数据 安全 删除 。 


8.2.4 TedFlash: 完备 数据 安全 删除 方案 


NFPS 机 制 通 过 隐藏 数据 删除 痕迹 的 方法 ， 使 得 政 手 无 法 在 NAND Flash 的 物理 镜像 中 检测 到 数据 删除 的 历史 ， 从 而 避免 敌手 利用 相 邻 数据 之 间 的 相关 性 
来 恢复 或 者 部 分 恢复 已 删除 的 数据 。 为 了 彻底 消除 数据 之 间 的 相关 性 ， 即 在 删除 数据 的 同时 ， 将 数据 在 存储 系统 中 留 下 的 各 种 结构 性 痕迹 也 彻底 消除 ， 使 得 删 
除数 据 后 的 存储 状态 与 已 删除 数据 从 未 出 现 过 的 存储 状态 之 间 无 法 区 分 ， 实 现 完备 数据 安全 删除 ，Bo 等 人 提出 了 TedFlash 机 制 。 


1. 政 手 模型 、 假 设 与 安全 定义 


Bo 等 人 在 设计 TedFlash 方 案 时 考虑 的 系统 模型 是 基于 NAND Flash 的 块 存储 设备 ， 文 件 系统 通过 基于 块 的 访问 接口 向 NAND Flash 发 送 读 写 命令 
TedFlash 面 向 的 是 一 次 访问 型 的 敌手 ， 且 该 政 手 计 算 能 力 有 限 。 这 符合 现实 中 很 多 的 应 用 场景 ， 比 如 丢失 装 有 eMMC 卡 的 手机 或 者 装 有 SSsD 的 笔记 本 电脑 ， 
从 而 可 使 敌手 获得 NAND Flash 存 储 介质 的 物理 和 逻辑 镜像 。 


一 个 完备 数据 安全 删除 方案 应 该 满足 两 个 特性 : 

1) 目标 删除 数据 从 存储 介质 中 删除 ， 从 而 使 得 敌手 不 能 直接 获得 数据 。 

2) 消除 由 目标 删除 数据 所 导致 的 结构 性 痕迹 ， 从 而 使 得 敌手 无 法 从 存储 设备 的 当前 存储 状态 推断 出 任何 目标 删除 数据 的 信息 。 
下 面 对 完 备 数据 安全 删除 方案 给 出 正式 的 定义 。 


假设 由 是 一 个 数据 安全 删除 机 制 ， 并 且 运 行 在 一 个 基于 NAND Flash 的 存储 设备 上 。 假 设 S 是 一 系列 对 存储 设备 的 访问 操作 ， 包 括 读 、 写 和 删除 操作 。S= 
{Ot0，Ot1，…，0Oti，.…，0Otn}， 其 中 Ot 表示 一 个 在 时 间 ti 对 存储 设备 的 访问 操作 ，0<i<n。 集 合 O' 是 S 中 的 删除 操作 ，0O" 是 S 中 删除 操作 所 对 应 的 写 操作 。52 
是 S$ 中 除去 O' 和 0O" 的 操作 和 集合。 敌手 在 tp 时 间 (tn 时 间 之 后 ， 新 操作 执行 之 前 ) 获得 存储 设备 的 存储 状态 。 假 设 p 是 政 手 识 别 出 是 操作 集合 S$ 还 是 $2 导致 的 tp 时 
刻 的 存储 状态 的 概率 ， 当 且 仪 当 p 趋 向 于 0 时 ,才能 称 由 为 一 个 “完备 数据 安全 删除 ”方案 。 


完备 数据 安全 删除 方案 与 传统 的 数据 安全 删除 方案 的 区 别 在 于 : 完备 数据 安全 删除 方案 同时 要 求 将 目标 删除 数据 导致 的 各 种 结构 性 痕迹 删除 。 换 句 话说 ， 
一 旦 数据 被 删除 ， 其 导致 的 存储 系统 的 存储 状态 与 其 从 未 出 现 过 的 存储 状态 无 法 区 分 。 这 就 可 以 保证 在 数据 删除 后 ， 政 手 在 获得 存储 设备 的 存储 状态 后 ， 将 不 
会 获得 任何 天 于 删除 数据 的 信息 (如 数据 具体 内 容 、 存 储 位 置 及 其 他 任何 关于 删除 数据 的 敏感 信息 ) 。 


2 万 案 设计 


为 了 消除 数据 的 结构 性 痕迹 ， 在 TedFlash 方 案 中 使 用 了 一 个 随机 映射 表 来 组 织 存储 在 NAND Flash 上 的 数据 。 一 方面 ， 通 过 随机 映射 表 可 以 保证 写 入 的 数 
据 忠 是 仓储 在 一 个 随机 的 位 置 上 ， 不 会 对 其 他 数据 的 存储 位 置 造成 影响 ， 因 此 消除 了 数据 的 结构 性 痕迹 。 删 除数 据 时 ， 只 需要 保证 删除 数据 本 身 ， 而 不 再 需要 
考虑 消除 写 入 数据 时 引入 的 在 存储 系统 状态 上 的 结构 性 痕迹 。 另 一 方面 ， 通 过 随机 映射 表 来 组 织 数 据 ， 符 合 NAND Flash 的 物理 特性 。 与 机 械 硬盘 不 
同 ，NAND Flash 在 读 写 时 不 需要 机 械 磁 头 的 调整 ， 因 此 随机 读 写 不 会 影响 系统 的 性 能 ;通过 随机 映射 表 来 组 织 数据 ， 可 以 很 好 地 在 NAND Flash 各 个 块 中 保 
证 编程 / 擦 除 的 均衡 ， 实 现 使 用 均衡 。 


由 于 采用 随机 映射 来 组 织 数据 ， 所 以 需要 维护 数据 在 上 层 文 件 系 统 的 逻辑 地 址 与 NAND Flash 物 理 地 址 之 间 的 映射 关系 ， 并 且 将 这 些 映 射 写 入 NAND 
Flash 中 ， 来 防止 友 生 如 挤 电 这 样 的 系统 突 友 情况。 但 是 这 融融 来 了 另外 一 个 问题 ， 在 NAND Flash 中 更 新 一 个 映射 束 需 要 执行 一 次 重 写 操 作 ， 即 需要 复制 
NAND Flash 一 个 块 中 的 有 效 数据 ， 探 除 此 块 ， 然 后 再 将 数据 写 回 此 块 ， 从 而 导致 严重 的 写 放 大 现象 。TedFlash 通 过 以 下 方法 来 解决 这 个 问题 : @@ 按 照 上 层 逻 
辑 地 址 顺序 来 组 织 地 址 映射 表 ; @ 累 积 多 个 地 址 映射 的 更 新 后 ， 同 时 在 NAND Flash 的 相应 位 置 上 进行 更 新 。 由 于 地 址 映射 表 是 按照 上 层 逻 辑 地 址 顺序 来 组 织 
的 ， 从 而 囚 积 的 映射 更 新 可 能 只 涉及 少数 几 个 块 ， 大 大 减少 了 映射 更 新 所 市 来 的 块 擦 除 操作 。 


(1) 随机 映射 表 


下 面 介绍 一 下 随机 映射 表 的 原理 。 假 设 数 组 t 中 共有 |L 个 元 素 ， 每 个 元 素 都 初始 化 为 0。 数 组 中 元 素 的 插入 过 程 是 : 假设 要 插入 元 素 X， 随 机 选择 | (0<i<L- 
1) ， 若 t 中 为 0%， 则 将 x 存 入 t 中 ， 否 则 继续 随机 选择 一 个 位 置 ， 直 到 找到 一 个 空位 置 来 存储 x。 要 将 数组 中 的 一 个 元 素 删 除 ， 只 需要 将 对 应 位 置 的 数据 清 零 。 按 
照 上 述 方式 组 织 随机 映射 表 的 好 处 是 在 固定 的 时 间 内 快速 地 实现 插入 和 删除 映射 。 


(2) 消除 结构 性 痕迹 


要 实现 完备 数据 安全 删除 ， 束 需要 将 数据 导致 的 结构 性 痕迹 也 删除 。 为 了 在 基于 NAND Flash 的 存储 设备 中 实现 完备 数据 安全 删除 ， 有 两 种 思路 : 一 种 是 
后 处 理 ， 即 当 需 要 删除 数据 时 ， 将 该 数据 导致 的 所 有 结构 性 痕迹 删除 ， 保 证 删除 数据 后 的 存储 状态 与 该 数据 从 未 出 现 过 的 存储 状态 无 法 区 分 。 但 是 这 种 后 处 理 
方式 会 在 NAND Flash 中 引入 严重 的 写 放 大 现象 ， 导 致 较 大 的 系统 开销 ; 另外 一 种 思路 是 预 处 理 ， 通 过 采用 特殊 的 数据 结构 来 组 织 数 据 ， 使 得 写 入 数据 的 存储 
位 置 不 会 影响 其 他 数据 的 存储 位 置 。 


TedFlash 采 用 了 预 处 理 思 路 ， 通 过 采用 随机 映射 表 来 组 织 数 据 ， 既 可 以 满足 真正 数据 安全 删除 的 要 求 ， 也 利用 了 NAND Flash 随 机 写 与 怖 序 写 性 能 基本 相 
同 的 物理 性 质 ， 同 时 实现 了 较 好 的 使 用 均衡 。 


(3) 元 数据 的 处 理 


TedFlash 将 来 自 于 上 层 系统 的 数据 存储 在 NAND Flash 的 随机 位 置 中 ， 因 此 需要 记录 数据 的 逻辑 地 址 与 NAND Flash 中 物理 地 址 的 映射 关系 。 由 于 数据 可 
能 会 被 更 新 、 删 除 ， 因 此 需要 及 时 更 新 对 应 的 地 址 映射 。 地 址 映射 需要 不 断 地 写 入 NAND Flash 中 ， 以 避免 发 生 系统 掉 电 等 特殊 情况 ， 然 而 这 导致 企 NAND 
Flash 中 存在 的 写 放 大 现象 。 


为 了 更 有 效 地 管理 地 址 映射 表 ，TedFlash 在 地 址 映射 表 中 按照 上 层 逻 辑 地 址 的 顺序 来 组 织 映射 ， 并 将 地 址 映射 表 人 存储 在 一 段 连 续 的 NAND Flash 物 理 块 
中 ， 称 为 元 数据 区 。 假 设 上 层 文 件 系统 在 逻辑 地 址 | (0<i<N，N 为 存储 系统 的 逻辑 地 址 总 数 ) 中 写 入 数据 ，TedFlash 将 数据 存储 在 NAND Flash 的 物理 位 置 
(a，b) 中 ， 其 中 a 代表 物理 块 号 ，b 代 表 此 块 中 的 物理 页 号 ， 则 在 地 址 映射 表 的 第 i 个 位 置 存 入 (a，b) ; 如 果 上 层 文 件 系统 删除 逻辑 地 址 的 数据 ， 则 将 地 址 
映射 表 中 的 第 i 个 位 置 内 容 置 为 空 ， 如 果 上 层 文 件 系 统 要 读 取 逻辑 地 址 的 数据 ， 则 根据 地 址 映射 表 中 的 第 i 个 位 置 所 存储 的 映射 找到 (a，b) ， 并 读 出 相应 的 物 
理 页 中 的 数据 。 


由 于 NAND Flash 读 写 操 作 的 基本 单位 是 页 ， 因 此 即使 读 取 一 个 地 址 映射 也 需要 将 整 页 的 映射 数据 读 出 来 。 为 了 实现 快速 的 读 取 映射 ， 提 高 系统 读 写 性 
能 ，TedFlash 将 全 部 或 者 部 分 地 址 映射 表 存 储 在 RAM 中。 注意 ， 当 前 商用 的 NAND Flash 存 储 设备 都 配置 有 较 大 容量 的 SRAM 或 者 DRAM ， 可 用 于 缓存 数据 。 
比如 Jasmine OpenSSD Platform 平台 配 有 96KB 的 SRAM 和 64MB 的 DRAM ，LPC-H3131 平 台 配 有 192KB 的 SRAM 和 32MB 的 DRAM 。 


按照 逻辑 地 址 的 顺序 来 组 织 地 址 映射 表 ， 可 以 实现 累积 更 新 的 地 址 映射 ， 减 小 更 新 地 址 映射 所 这 来 的 系统 开销 ， 但 是 如 果 只 在 RAM 中 更 新 映射 ， 一 旦 近 
电 就 会 丢失 数据 。TedFlash 采 用 日 志 块 来 解决 这 一 问题 : 将 没有 更 新 到 NAND Flash 上 的 映射 按 顺序 存储 在 一 组 日 志 块 中 ， 当 日 志 块 中 的 页 用 完 时 ， 将 日 志 块 
中 记录 的 更 新 的 映射 写 入 NAND Flash 中 对 应 的 地 址 映射 块 中 ， 然 后 再 删除 日 志 块 。 最 后 ， 出 于 使 用 均衡 的 考虑 ， 选 择 另 外 一 组 块 作 为 日 志 块 ， 记 录 更 新 的 地 
址 映射 。 敌手 可 能 通过 在 记录 映射 更 新 的 日 志 块 中 获得 最 近 更 新 的 逻辑 地 址 映射 (比如 日 志 块 个 数 为 1， 每 块 64 页 ， 则 敌手 最 多 会 获得 64 个 最 近 更 新 的 逻辑 地 
址 信息 ) ， 但 是 当日 志 块 中 页 使 用 完毕 ， 日 志 块 束 会 被 擦 除 ， 这 些 泄露 束 会 被 避免 。 


存储 元 数据 (如 地 址 映射 ) 的 块 可 能 存在 使 用 不 均衡 的 现象。 一 方面 ， 由 于 上 层 文 件 系统 的 写 数 据 位 置 可 能 集中 在 某 一 学 围 内 ， 由 于 地 址 映射 按照 逻辑 地 


址 的 顺序 排列 ， 因 此 这 些 经 冲 更 新 的 地 址 映射 块 残 需要 进行 多 次 的 编程 / 探 除 操作 。 另 一 方面 ， 由 于 元 数据 相对 于 用 户 数据 较 小 ， 而 更 新 的 次 数 是 一 样 的 ， 所 
以 存储 元 数据 的 块 ， 相 对 于 存储 用 户 数 据 的 块 ， 需 要 进行 更 多 次 的 编程 / 擦 除 操作 。 如 果 每 一 个 地 址 映射 是 4B， 每 一 个 数据 页 是 4KB， 元 数据 只 占 整 个 NAND 
Flash 容 量 的 0.1%， 即 对 于 一 个 10GB 的 eMMC 卡 只 有 10MB 的 元 数据 。 使 用 均衡 算法 可 以 保证 将 存储 元 数据 的 块 扩展 到 整个 NAND Flash 块 中 ,保证 NAND 
Flash 的 使 用 寿命 。 


(4) 优化 的 TedFlash 方 案 


当 目 标 删除 数据 的 大 小 与 NAND Flash 块 大 小 相近 时 ， 安 全 删除 数据 不 会 导致 严重 的 写 放 大 问题 。 但 是 ， 当 目标 删除 数据 较 小 时 ， 通 过 探 除 数据 所 在 的 
NAND Flash 块 将 会 导致 严重 的 写 放 大 问题 。 由 于 采取 了 随机 映射 的 机 制 ， 打 乱 了 相 邻 逻辑 地 址 数据 在 NAND Flash 上 存储 位 置 之 间 的 相关 性 ， 因 此 即使 通过 
累积 删除 数据 也 无 法 减 小 这 个 写 放 大 问题 。 


受 DNEFS 方 案 的 局 示 ，Bo 等 人 提出 了 优化 的 TedFlash 方 案 : 将 每 一 页 中 的 数据 用 唯一 的 密 钥 加 密 ， 当 需要 删除 数据 时 ， 只 需要 删除 对 应 的 密 钥 。 这 样 做 
的 好 处 是 : 


1) 由 于 密 钥 的 大 小 (如 16B) 比 每 页 数据 (如 2KB) 小 ， 可 以 将 密 钥 也 按照 上 层 逻 辑 地 址 的 顺序 进行 组 织 ， 从 而 明显 减 小 由 删除 密 钥 所 导致 的 系统 开销 。 


2) 通过 延迟 删除 加 密 后 的 数据 页 ， 直 到 一 个 块 中 累积 了 足够 多 的 无 效 数据 后 才 会 探 除 该 物理 块 ， 避 免 立 即 对 一 个 块 进行 探 除 ， 以 此 减少 由 删除 数据 所 导 
致 的 系统 开销 。 


值得 注意 的 是 ， 虽 然 需要 被 删除 的 密 文 数据 仍然 保存 企 NAND Flash 存 储 介 质 上 ， 但 是 : 

1) 由 于 密 文 数据 的 密 钥 已 经 被 删除 ， 政 手 无 法 解密 密 文 ， 对 收 手 来 说， 这 些 未 被 删除 的 密 文 只 是 一 系列 随机 数 。 

2) 由 于 对 应 的 地 址 映射 信息 也 已 经 被 删除 ， 所 以 政 手 无 法 关联 到 未 删除 密 文 数据 的 相关 数据 。 

3) NAND Flash 上 的 数据 位 置 分 配 是 随机 的 ， 打 乱 了 数据 在 逻辑 地 址 空间 之 间 的 相关 性 ， 政 手 无 法 获知 这 些 未 删除 密 文 数据 的 逻辑 位 置信 息 。 


因此 ， 现 在 的 问题 变 为 ， 如 何 组 织 、 管 理 密 铀 ， 从 而 快速 有 效 地 实现 密 钥 删除 。 与 地 址 映射 的 组 织 方式 一 样 ，TedFlash 按 照 上 层 逻 辑 地 址 的 顺序 来 存储 密 
铀 。 上 层 文 件 系 统 逻 辑 地 址 j (0<i<N，NN 为 存储 系统 的 逻辑 地 址 总 数 ) 的 密 钥 存 储 在 密 钥 表 的 第 i 个 位 置 中 。 起 初 ， 密 钥 表 初始 化 为 一 系列 随机 数 。 当 上 层 文 
件 系 统 在 逻辑 地 址 i 写 数 据 时 ， 则 TedFlash 利 用 密 钥 表 中 的 第 i 个 位 置 的 密 钥 加 密 数 据 ; 如 果 上 层 文件 系统 删除 逻辑 地 址 i 的 数据 时 ， 则 将 密 钥 表 中 的 第 i 个 位 置 内 
容 蔡 换 为 一 个 新 的 随机 数 ; 如 果 上 层 文件 系统 要 读 取 逻 辑 地 址 i 的 数据 ， 则 读 取 密 钥 表 中 的 第 i 个 位 置 所 存储 的 密 钥 ， 用 于 解密 相应 物理 页 中 的 数据 。TedFlash 
将 密 钥 表 存 储 在 一 段 连 续 的 NAND Flash 物 理 块 中 ， 称 为 密 钥 区 。 


与 地 址 映射 表 一 样 ，TedFlash 也 将 部 分 或 者 全 部 密 钥 加 载 到 RAM 中 ， 以 提高 读 写 密 钥 的 效率 ， 并 同时 引入 日 志 块 来 记录 还 没有 更 新 到 NAND Flash 上 密 
钥 区 的 密 钥 。 密 钥 区 的 数据 块 相对 于 用 户 数 据 区 的 数据 块 可 能 面临 着 更 多 的 编程 / 擦 除 次 数 ， 但 是 密 钥 区 的 数据 块 非常 少 (比如 每 个 密 钥 长 16B， 每 个 数据 页 
4KB， 密 钥 区 只 占 整个 NAND Flash 容 量 的 0.4%) ， 只 需要 利用 使 用 均衡 策略 ， 将 密 钥 区 的 数据 块 周期 性 地 扩展 到 整个 NAND Flash 中 即 可 保证 存储 设备 的 寿 


全 
ADo 
3. 实 验 


Bo 等 人 将 TedFlash 在 OpenNFM 平 台 上 做 了 实验 。 为 了 进行 对 比 ， 同 时 在 该 平台 上 实现 了 DNEFS 和 HiFlash 方 案 。DNEFS 方 案 对 每 页 数据 都 采取 唯一 密 
钥 进 行 加 密 ， 通 过 删除 密 钥 来 保证 删除 数据 ， 但 是 却 不 能 删除 数据 在 存储 系统 中 引入 的 结构 性 痕迹 ;HiFlash 是 第 一 个 在 NAND Flash 存 储 设备 上 实现 历史 独立 
性 的 方案 ,同样 对 每 页 数据 都 采取 唯一 密 钥 进 行 加 密 ， 通 过 删除 密 钥 来 保证 删除 数据 ， 严 格 按照 上 层 逻 辑 地 址 一 一 映射 的 关系 来 组 织 存 储 介质 上 的 数据 ， 这 导 
致 在 NAND Flash 上 引入 了 严重 的 写 放 大 现象 ， 所 以 并 不 实用 。 


OpenNFM 平 台中 包含 了 三 层 逻 辑 结构 : FTL 层 ， 负 责 管理 上 层 逻 辑 地 址 与 NAND Flash 物 理 地 址 的 映射 ， 使 得 NAND Flash 可 向 上 层 文 件 系统 提供 一 个 统 
一 的 块 设备 访问 接口 ，UBI 层 ， 负 责 管理 使 用 均衡 和 垃圾 回收 ; MTD 层 ， 提 供 对 NAND Flash 心 片 的 抽象 ， 屏 蔽 不 同 NAND Flash 必 片 的 物理 特性 。 


Bo 等 人 将 修改 好 的 上 述 三 种 方案 移植 到 了 OpenNFM 平 台 自 带 的 开发 板 LPC-H3131， 该 开发 板 配 有 180MHz 的 ARM 微 处 理 器 、512MB 的 NAND Flash、 
32MB 的 SDRAM。NAND Flash 的 每 页 大 小 为 2KB， 每 块 售 有 64 页 。 在 一 台 配 有 lntel 17、3.4GHz 处 理 器 、4GB 内 存 、 安 装 了 Windows7 的 32 位 操作 系统 的 主 
机 上 ， 利 用 FIO 工 具 [34] 测 试 了 三 种 方案 具体 的 读 写 性 能 。 


(1) 读 写 性 能 


LPC-H3131 开 上 友 板 没有 专门 的 硬件 加 密 模块 ， 只 配 有 一 个 低 端 的 微 处理 器 (180MHz) ， 所 以 在 该 开发 板 上 执行 基于 软件 的 加 解密 的 代价 是 非常 大 的 。 
此 ， 如 果 将 加 解密 操作 的 开销 也 算 入 由 TedFlash 方 案 本 身 引 起 的 开销 是 不 合适 的 。 通 过 观察 ， 大 量 新 一 代 商 用 的 智能 手机 及 SSD 的 控制 器 中 已 经 配置 了 硬件 加 
密 模 块 ， 如 三 星 公司 生产 的 SSD 都 已 经 增加 了 硬件 AES 加 密 功能 。 表 8-3 中 列举 了 SAGE S881 型 [42]SSD 控 制 器 在 加 解密 和 非 加 解密 两 种 情况 下 的 读 写 速率 对 
比 ， 这 个 控制 器 自 市 硬件 AES-128 加 密 模块 。 从 表 中 数据 可 以 看 出 ， 在 配 有 硬件 加 解密 模块 的 控制 器 中 ， 加 解密 不 会 对 系统 的 读 写 造 成 重大 的 影响 ， 所 以 接 下 
来 我 们 将 排除 加 解密 的 性 能 影响 。 


表 8-3 SAGE $S881 型 SSD 控 制 器 的 加 解密 和 非 加 解密 读 写 速率 对 比 


不 执行 加 解密 《MB/s) 470 


执行 加 解密 (MB/s) 460 460 
性 能 下 降 11.5% 2.1% 


为 了 有 效 地 更 新 地 址 映射 和 密 钥 ，TedFlash 引 入 了 日 志 块 来 罕 积 更 新 ， 并 在 元 数据 块 区 和 密 钥 区 执行 地 址 映射 和 密 钥 的 更 新 。 表 8-4 中 列举 了 随 着 日 志 块 
数量 的 变化 写 性 能 (单位 为 KB/s) 的 变化 情况 。 表 中 用 (x，y) 表示 日 志 块 的 数量 ， 其 中 x 表示 分 配给 地 址 映射 的 日 志 块 数目 ，y 表 示 分 配给 密 钥 的 日 志 块 数 
目 ，(0，0) 表示 不 在 元 数据 区 和 密 钥 区 执行 更 新 。 注 意 ， 每 个 日 志 块 含有 64 页 ， 而 NAND Flash 的 写 操作 的 单位 是 1 页 ， 所 以 每 个 日 志 块 可 以 存储 64 个 地 址 
映射 更 新 或 者 密 钥 更 新 。 通 过 表 中 的 数据 可 以 看 出 ， 随 着 日 志 块 个 数 的 增多 ，TedFlash 的 写 性 能 逐渐 提高 ， 并 与 不 执行 地 址 映射 和 密 钥 更 新 的 情况 接近 。 这 是 
因为 ， 随 着 日 志 块 个 数 的 增多 ， 囚 积 的 更 新 属于 一 个 块 的 可 能 性 束 越 大 ， 从 而 减 小 了 系统 由 于 更 新 数据 而 擦 除 块 的 开销 。 


表 8-4 日 志 块 个 数 对 写 性 能 的 影响 


日 志 块 个 数 顺序 读 (KB/s) 随机 读 (KB/s) 


表 8-5 中 比较 了 DNEFS、HiFlash、TedFlash 的 读 写 性 能 ， 单 位 为 KLB/s。 为 了 有 效 地 读 取 映射 信息 和 密 钥 ， 将 所 有 地 址 映射 表 和 密 钥 表 加 载 到 厂 上 DRAM 


表 8-5 各 种 方案 读 写 性 能 对 比 


在 TedFlash 中 各 使 用 了 3 个 日 志 块 来 标 积 地 址 映射 和 密 钥 的 更 新 ， 通 过 观察 表 8-5 中 的 数据 ， 可 以 得 出 以 下 结论 : 


1) 与 原 OpenNFM 方 案 相 比 ，DNEFS 和 TedFlash 方 案 的 读 写 性 能 都 有 所 下 降 。 这 是 由 于 在 DNEFS 和 TedFlash 方 案 增 加 了 密 钥 管理 ， 包 括 读 密 钥 和 密 钥 
的 更 新 。 


2) TedFlash 方 案 的 读 写 性 能 相 比 DNEFSs 方 案 有 略微 下 降 (大 约 10%) 。 这 是 由 于 在 NAND Flash 中 随机 读 写 虽然 不 会 对 系统 造成 大 的 影响 ， 但 是 仍 会 对 
系统 带 来 较 小 的 性 能 影响 。 这 也 说 明了 TedFlash 方 案 可 以 以 较 小 的 代价 实现 完备 安全 数据 删除 。 


3) HiFlash 方 案 的 写 性 能 ， 尤 其 是 随机 写 性 能 ， 相 对 于 TedFlash 方 案 有 严重 的 下 降 。 这 是 由 于 HiFlash 方 案 中 的 一 对 一 映射 造成 大 量 的 数据 重 写 ， 从 而 引 
起 严重 的 写 放 大 现象 造成 的 。 


(2) 使 用 均衡 


Bo 等 人 利用 了 胡 佛 经 济 财 富 不 平等 措 标 (Hoover economic wealth inequality indicator) 来 评估 TedFlash 的 使 用 均衡 的 效果 。 胡 佛经 济 财富 不 平等 指 
标 最 初 是 用 来 估计 财富 分 配 的 不 均衡 性 。 对 于 NAND Flash 来 说 ， 可 以 用 来 表示 各 个 物理 块 编程 / 探 除 次 数 的 分 配 情况 。 假 设 一 个 NAND Flash 心 片 共有 n 个 物 


n lie, 1 
1 i 


理 块 ， 每 个 块 的 擦 除 次 数 是 e1、e2、..en， 所 有 快 的 深 除 次 数 之 和 为 E， 那 么 使 用 均衡 系数 为 ?| 














> 和 
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Bo 等 人 在 开发 板 中 写 满 数据 ， 大 约 为 512MB， 然 后 全 部 擦 除 ， 表 次 写 入 数据 ， 直 到 写 入 数据 量 达 到 500GB。 最 终 计 算出 使 用 均衡 次 数 为 6x10-4， 非 常 接 
近 于 0， 说 明 TedFlash 方 案 的 使 用 均衡 机 制 效 果 较 好 ， 也 说 明了 随机 分 配 写 入 数据 位 置 本 身 融 可 以 市 来 非常 好 的 使 用 均衡 效果 ， 从 而 保证 NAND Flash 和 存储 设 
备 的 使 用 寿命 。 


TedFlash 方 案 通 过 加 密 数据 、 及 时 删除 密 钥 的 方式 ， 保 证 政 手 不 能 恢复 已 删除 数据 ; 利用 随机 映射 表 来 分 配 写 入 数据 位 置 ， 消 除了 数据 在 仓储 系统 中 的 结 
构 性 痕迹 ， 使 得 敌手 不 能 通过 数据 相关 性 获得 已 删除 数据 的 信息 ， 这 符合 NAND Flash 随 机 读 写 性 能 较 好 的 特性 ， 并 达到 了 很 好 的 使 用 均衡 效果 。 总 的 来 
说 ，TedFlash 方 案 以 较 小 的 系统 代价 实现 了 比 传统 数据 删除 方案 更 加 安全 的 完备 数据 安全 删除 。 


[1] 芯片 H 和 芯片 IT 没有 产生 错误 。 


8.3 ”文件 系统 层 万 案 


在 文件 系统 中 实现 数据 安全 删除 ， 最 简单 的 方法 融 是 紧凑 法 ， 即 把 含有 要 删除 的 数据 的 块 集 中 起 来 ， 把 其 中 的 有 效 数 据 复制 到 其 他 空闲 块 后 再 执行 控 除 操 
作 ， 然 而 这 种 方法 的 缺点 是 复制 数据 需要 消耗 时 间 ， 擦 除 块 会 造成 磨损 ， 因 而 系统 开销 较 大 。 对 紧凑 法 进行 改进 后 的 方法 称 为 分 批 紧 凑 法 ， 即 间 吹 性 地 在 含有 
要 删除 的 数据 的 块 上 执行 数据 安全 删除 ， 尽 管 有 删除 延迟 ， 每 次 执行 删除 时 的 延迟 大 ， 但 分 摊 到 每 一 个 擦 除 块 的 时 延 和 对 数据 块 的 擦 写 寿命 损耗 减少 了 ， 也 可 
以 用 类 似 于 垃圾 回收 中 的 优化 策略 来 减少 执行 删除 的 操作 次 数 。 


面向 NAND Flash 文 件 系统 层 的 数据 安全 删除 方案 ,一般 是 在 修改 YAFFS 以 及 UBIFS 的 基础 上 实现 的 。YAFFS、UBIFS 是 专门 为 NAND Flash 设 计 的 日 志 式 
文件 系统 ， 它 们 通过 直接 提供 地 址 映射 、 坪 圾 回收 、 使 用 均衡 、 坏 块 管理 等 功能 ， 可 以 直接 控制 “ 裸 NAND Flash， 而 不 需要 通过 FTL 进 行 转换 。 接 下 来 分 


别 详细 介绍 这 两 类 方案 。 
8.3.1 基于 YAFFS 的 方案 


天 于 YAFFs 的 详细 介绍 请 参考 本 书 第 6 章 。 
1.Sun 等 人 的 方案 
Sun 等 人 在 2008 年 提出 了 第 一 个 针对 YAFFS 实 现 的 数据 安全 删除 方案 。 


他 们 提出 了 在 YAFFS 中 增加 用 “0” 重 写 页 和 块 擦 除 两 个 拷 术 来 实现 数据 安全 删除 的 方案 。 通 过 分 析 这 两 种 技术 的 系统 开销 ， 选 择 开销 较 小 的 方法 来 安全 
删除 文件 数据 。 其 中 用 “0” 重 写 页 的 技术 思想 与 Scrubbing 方 案 的 思想 一 样 ， 但 是 在 Sun 等 人 的 方案 中 ， 只 是 将 用 “0” 重 写 页 技术 加 入 到 YAFFS 中 ， 而 没有 
扩展 到 FTL 中 。 最 重要 的 是 Sun 等 人 没有 在 具体 的 NAND Flash 心 片 中 对 该 技术 进行 实际 的 验证 ， 分 析 该 技术 对 心 片 造成 的 物理 影响 ， 而 只 是 提出 了 解决 思路 ， 
因此 并 没有 引起 学 术 界 、 产 业界 的 广泛 关注 。 


结合 图 8-16 讲 述 Sun 等 人 方案 的 原理 。NAND Flash 心 片 特殊 的 物理 性 质 导 致 写 数 据 前 必须 执行 擦 除 操作 ， 但 NAND Flash 心 片 允 许 对 已 经 写 入 数据 的 物 
理 页 再 次 进行 编程 ， 即 重 写 操作 。 如 图 8-16a 所 示 ， 可 以 对 过 时 的 、 需 要 被 安全 删除 的 数据 页 再 次 进行 编程 操作 ， 将 该 页 中 所 有 的 存储 单元 变 成 “0” ， 从 而 达 
到 删除 该 页 内 容 的 目的 。 块 擦 除 思 想 比 较 简 单 ， 如 图 8-16b 所 示 ， 将 一 个 块 中 的 所 有 存储 单元 变 成 “1”。 
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图 8-16 ”Sun 等 人 方案 的 原理 
Sun 等 人 通过 分 别 计算 用 “0” 重 写 页 和 块 擦 除 两 个 技术 的 系统 开销 ， 选 择 其 中 系统 开销 较 小 的 技术 作为 目标 数据 安全 删除 的 技术 。 其 主要 过 程 如 下 : 
1) 查找 要 删除 的 页 。 
2) 计算 用 “0” 重 写 要 安全 删除 的 页 的 系统 开销 与 收益 : 
用 “0” 重 写 系统 开销 = 要 删除 的 页 数目 x 页 编程 时 间 


用 “0” 重 写 系 统 收益 =0 (因为 用 “0” 重 写 的 页 仍 不 可 用 于 写 入 新 数据 ) 


所 以 用 “0” 重 写 技 术 删 除 目标 数据 页 的 系统 消耗 是 : 

用 “0” 重 写 系 统 开销 -用 “0” 重 写 系统 收益 = 要 删除 的 页 数目 x 页 编程 时 间 

3) 计算 擦 除 目标 删除 数据 页 所 在 块 的 系统 开销 与 收益 : 

块 擦 除 系统 开销 = 该 块 中 要 删除 的 页 数目 x 〈 读 一 页 时 间 + 页 编程 时 间 ) 

块 擦 除 系统 收益 = (一 块 中 页 数目 -该 块 中 要 删除 的 页 数目 ) x ( 块 擦 除 时 间 ) / (一 块 中 的 页 数目 ) 
用 块 擦 除 技术 删除 目标 数据 页 的 系统 消耗 是 : 块 擦 除 系统 开销 - 块 擦 除 系统 收益 。 


4) 比较 用 “0” 重 写 页 技术 删除 目标 数据 页 的 系统 消耗 和 用 块 擦 除 技术 删除 目标 数据 页 的 系统 消耗 的 大 小 ， 选 择 其 中 开销 较 小 的 一 个 对 目标 数据 进行 数据 
的 安全 删除 。 


根据 分 析 以 及 实验 结果 ， 当 一 个 块 中 要 删除 的 目标 页 较 少时 ， 趋 向 于 使 用 用 “0” 重 写 页 技术 来 删除 目标 数据 页 的 方案 ; 而 当 一 个 块 中 要 删除 的 目标 页 较 
多 时 ， 趋 向 于 使 用 块 探 除 技术 来 删除 目标 数据 页 的 方案 。 


2.Lee 等 人 的 方案 
Lee 等 人 在 2008 年 提出 了 通过 修改 YAFFS 来 支持 安全 删除 单个 文件 数据 的 方案 。 


由 于 YAFFS 是 日 志 结 构 的 文件 系统 ， 可 能 有 多 个 文件 具有 相同 的 文件 id 和 组 块 号 ， 因 此 要 在 YAFFS 中 实现 安全 删除 文件 ， 这 个 文件 的 原 对 象 头 (object 
header) 和 当前 对 象 头 都 应 该 被 删除 。Lee 等 人 的 方案 是 将 每 一 个 文件 用 唯一 的 、 随 机 产生 的 密 钥 加 密 ， 所 有 文件 以 密 文 的 形式 存储 在 NAND Flash 中 。 将 每 
个 文件 的 密 钥 及 文件 的 元 数据 存 入 一 个 对 象 头 中 ， 并 强制 将 每 个 文件 的 对 和 象 头 保存 在 同一 个 数据 块 中 。 因 此 ， 要 删除 文件 时 ， 只 需要 进行 一 次 块 擦 除 操作 束 可 
以 保证 既 删除 了 加 密 密 钥 ， 同 时 又 删除 了 文件 的 元 数据 ， 实 现 文 件数 据 的 安全 删除 。 对 整个 文件 以 固定 的 消耗 进行 安全 删除 ， 通 过 只 删除 单个 文件 的 元 数据 来 
减少 安全 删除 的 消耗 。 


图 8-17 详 细 解 释 Lee 等 人 的 方案 。 首 先是 文件 的 加 密 过 程 。 每 一 个 文件 的 加 密 密 钥 (如 Key1、Key2 等 ) 是 随机 产生 的 ， 并 且 是 唯一 的 。 数 据 经 过 加 密 后 ， 
密 文 存储 在 数据 块 中 ， 密 钥 保 存在 文件 对 象 头 中 并 存储 在 对 象 头 块 中 ， 强 制 要 求 每 一 个 文件 的 对 象 头 保存 在 同一 个 对 象 头 块 (header block) 中 ， 但 是 同一 个 
对 象 头 块 可 以 存储 不 同文 件 的 对 象 头 元 数据 。 当 一 个 对 象 头 块 中 的 页 用 完 时 ， 需 要 对 此 对 象 头 块 进行 处 理 ， 把 该 对 象 头 块 中 有 效 的 文件 对 象 头 元 数据 复制 到 一 
个 新 的 空 采 块 中 ， 并 探 除 此 对 象 头 块 。 
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b) 通过 删除 文件 密 钥 安全 删除 文件 数据 过 程 


图 8-17 Lee 等 人 的 方案 原理 


接 下 来 是 通过 删除 文件 密 钥 来 实现 安全 删除 文件 数据 的 过 程 。 当 要 删除 一 个 文件 时 ， 需 要 将 此 文件 的 元 数据 全 部 删除 ， 因 此 需要 先 将 其 元 数据 所 在 的 对 象 
头 中 其 他 文件 的 有 效 元 数据 复制 到 其 他 空 闪 对 象 头 块 中 ， 然 后 表 擦 除 目标 删除 文件 元 数据 所 在 的 对 象 头 块 ， 而 不 需要 对 数据 块 中 文件 的 加 密 数 据 进 行 处 理 。 


3.Reardon 等 人 的 方案 


2012 年 ，Reardon 等 人 针对 日 志 式 文件 系统 YAFFS， 提 出 了 多 个 数据 安全 删除 方法 。 其 中 包括 两 个 用 户 应 用 级 方法 (Purging 和 Balloning) ， 一 个 内 核 


驱动 级 别 的 方法 (用 “0” 重 写 ) ， 并 将 上 述 方法 在 Android 智 能 手机 上 进行 了 实现 。 


用 户 级 应 用 程序 对 底层 NAND Flash 的 访问 是 受 限 的 ， 文 件 系统 只 给 上 层 应 用 系统 提供 了 文件 创建 、 修 改 、 删 除 等 接口 功能 。 所 以 ， 应 用 程序 无 法 控制 广 
件 系统 直接 执行 特定 的 NAND Flash 块 探 除 操作 ， 也 无 法 控制 特定 的 人 存储 区 域 及 时 执行 垃圾 回收 操作 ， 而 且 无 法 获知 用 户 数据 被 存在 NAND Flash 中 的 位 置 。 


(1) 用 户 应 用 级 方法 Purging 


在 应 用 YAFFs 的 人 存储 设备 中 ， 要 在 用 户 应 用 层 中 实现 所 有 敏感 数据 的 安全 删除 ， 必 须要 确保 目标 数据 所 在 的 块 被 擦 除 ， 这 融 需 要 修改 YAFFs 中 分 配 块 的 筑 
略 。 最 坏 的 情况 束 是 在 一 个 块 中 只 有 一 页 数据 需要 被 安全 删除 ， 在 这 种 情况 下 也 必须 先 将 此 块 中 的 有 效 页 复制 到 新 的 空闲 块 中 ， 然 后 对 此 块 进行 擦 除 。 


Purging 方 法 的 原理 是 用 志 圾 文件 填充 文件 系统 中 的 空 汀 区域， 然后 再 将 垃圾 文件 删除 ， 以 此 保证 将 需要 删除 的 数据 安全 删除 。 这 里 的 空 亲 区 域 包括 未 分 
配 区 域 ， 即 已 被 擦 除 但 还 未 使 用 的 块 区 域 ， 以 及 被 标 记 为 已 删除 但 实际 还 未 回收 、 探 除 的 块 区 域 。 将 空 亲 区 域 填 充满 垃圾 文件 后 ， 将 强制 性 地 导致 YAFFs 执 行 
坪 圾 回收 ,使 得 对 含有 垃圾 文件 和 标记 为 “已 删除 ”但 实际 还 没有 被 回收 、 擦 除 的 文件 数据 所 在 的 NAND Flash 块 执行 真正 的 数据 回收 、 块 擦 除 操作 ， 来 确保 
需要 安全 删除 的 敏感 文件 数据 最 终 全 部 安全 删除 。 


Reardon 等 人 在 Android 手 机 上 进行 了 原型 实验 验证 ， 在 手机 上 运行 修改 后 的 YAFFS。 为 了 验证 Purging 方 法 的 有 效 性 ， 需 要 提取 NAND Flash 忌 片上 物 
理 镜 像 的 数据 ， 方 法 是 先 获 得 Android 手 机 的 root 权 限 ， 外 载 NAND Flash 驱 动 ， 用 cat 命 令 将 NAND Flash 上 的 原 数据 复制 到 外 部 SD 卡 ， 然 后 将 SD 卡 上 的 原 
数据 复制 到 桌面 计算 机 上 ， 并 用 grep 或 者 hexdump 等 软件 工具 对 数据 进行 分 析 。 


接 下 来 验证 Purging 方 法 的 有 效 性 。 他 们 首先 在 手机 存储 设备 中 写 入 该 设备 之 前 没有 的 一 些 随机 秘密 模式 数据 ， 然 后 通过 上 述 方 法 获得 NAND Flash 心 片 
的 物理 镜像 ， 并 验证 随机 秘密 模式 数据 已 真正 被 写 入 NAND Flash 中 。 将 随机 秘密 模式 数据 删除 ， 再 次 获得 NAND Flash 芯 片 的 物理 镜像 ， 并 验证 随机 秘密 模 
式 数 据 仍然 存在 于 NAND Flash 中 。 执 行 Purging 操 作 ， 在 存储 设备 的 空闲 区 域 中 填 满 垃圾 文件 ， 然 后 删除 垃圾 文件 ，YAFFS 将 执行 垃圾 回收 ， 再 次 获得 
NAND Flash 心 片 的 物理 镜像 ， 可 验证 此 时 随机 秘密 模式 数据 已 经 被 真正 地 从 NAND Flash 中 擦 除 。 


但 是 ， 加 入 Purging 方 法 的 YAFFS 必 须 能 够 有 效 地 对 每 一 个 NAND Flash 块 都 执行 垃圾 回收 后 ， 才 能 保证 将 所 有 的 目标 数据 全 部 安全 删除 。 他 们 在 一 个 
Nexus One 手 机 上 的 实验 表明 ， 大 约 75 个 小 时 才能 保证 所 有 的 块 被 擦 除 。 所 以 ，Purging 方 法 只 适用 于 在 手机 等 存储 设备 处 于 待机 状态 的 时 候 执 行 数据 安全 删 
除 ， 而 且 并 不 实用 。 


(2) 用 户 应 用 级 方法 Ballooning 


为 了 减少 Purging 方 法 的 执行 时 间 ，Reardon 等 人 对 Purging 方 法 进行 改进 ， 提 出 了 另外 一 个 用 户 应 用 级 的 数据 安全 删除 方法 ， 即 Ballooning 方 法 。 
Ballooning 方 法 的 原理 也 是 在 文件 系统 区 域内 填写 大 量 坪 圾 文件 ， 导 致 可 分 配 的 块 减少 ， 从 而 强制 引起 YAFFS 执 行 垃圾 回收 ,减少 系统 中 各 个 块 的 分 配 周期 ， 
保证 回收 、 擦 除 实际 要 删除 的 文件 数据 。 


为 了 减少 系统 的 执行 时 间 ，Ballooning 方 法 设置 了 可 分 配 区 域 容量 的 最 小 值 和 最 大 值 。 结 合 图 8-18 解 释 一 下 Balloning 方 法 的 原理 。Balloning 方 法 在 基于 
YAFFS 的 Android 手 机 中 周期 性 运行 ， 当 系统 可 分 配 区 域 容量 小 于 最 小 值 时 ， 则 删除 部 分 垃圾 文件 ， 当 可 分 配 区 域 容量 大 于 最 大 值 时 ， 则 需要 向 可 分 配 区 域 中 
填写 一 定数 量 的 垃圾 文件 。 系 统 总 是 保证 先 删 除 写 入 较 久 的 垃圾 文件 ， 而 保留 最 近 才 被 写 入 的 垃圾 文件 ， 以 此 来 保证 NAND Flash 中 各 个 块 的 使 用 均衡 。 
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图 8-18 ”Balloning 方 法 的 原理 


所 以 ，Balloning 方 法 就 像 一 个 气球 一 样 ， 填 充 在 系统 的 可 分 配 区 域 中 ， 使 得 系统 可 分 配 区 域 的 容量 始终 保持 在 一 个 合适 的 范围 内 。Ballooning 方 法 的 优 
所 是 使 得 系统 执行 垃圾 回收 时 ， 对 实际 要 擦 除 的 文件 操作 时 间 可 以 取 到 期 望 的 最 小 值 。 


Purging 方 法 和 Balloning 方 法 都 需要 系统 执行 大 量 的 不 必要 的 写 和 擦 除 操 作 ， 这 无 疑 会 对 只 有 有 限 的 擦 写 寿命 的 NAND Flash 数 据 块 造成 严重 的 损害 。 而 
且 ， 这 两 种 方法 的 执行 时 间 较 长 ， 只 能 在 系统 处 于 静止 状态 时 (如 手机 锁 屏 时 ) 运行 ， 以 此 来 保证 数据 的 安全 删除 。 





(3) 内 核 层级 方法 一 一 用 “0” 重 写 
如 果 一 个 用 尸 在 移动 手机 设备 上 安 六 上 系统 内 核 后 ， 并 愿意 获得 系统 的 超级 权限 ， 即 系统 可 以 被 “root”， 束 可 以 在 系统 内 核 级 别 实现 数据 的 安全 删除 方 


料 


。 在 系统 内 核 层 级 中 实现 数据 安全 删除 的 优点 是 可 以 减少 用 户 操作 ， 对 用 户 透 明 。 


Reardon 等 人 提出 的 内 核 层级 的 方法 是 修改 YAFFS: 当 系 统 执行 删除 文件 、 缩 短文 件 、 更 新 文件 等 操作 时 ， 立 即 用 “0” 重 写 过 时 文件 所 在 的 物理 页 。 本 
方案 也 融 是 将 Scrubbing 方 案 的 思想 添加 到 YAFFs 中 。 


YAFFs1 通 过 使 用 多 次 编程 技术 ， 即 可 在 一 次 块 控 除 操作 之 后 对 该 块 中 的 一 页 进行 多 次 编程 操作 的 技术 ， 使 得 每 一 页 的 扩展 区 域 中 “已 被 删除 的 chunk 
块 ” 的 标志 位 从 1 变 为 0， 表 明 该 页 已 被 更 新 ， 从 而 可 以 被 删除 。 但 是 ， 这 个 技术 在 很 多 NAND Flash 心 片 中 不 被 推荐 使 用 ， 因 此 在 YAFFS2 中 取消 了 这 个 技 
术 。 但 是 用 “0” 重 写 这 个 方法 只 需 在 NAND Flash 的 存储 单元 施加 较 小 的 电压 ， 并 且 没 有 执行 擦 除 操作 ， 因 此 不 会 对 NAND Flash 本 身 的 寿命 造成 影响 。 


本 方案 与 Sun 等 人 的 方案 不 同 的 是 ，Reardon 等 人 测试 了 多 种 不 同 的 用 户 删 除 文件 的 方式 ， 包 括 删除 文件 、 完 全 重 写 文件 、 部 分 重 写 文 件 、 完 全 截断 文 
件 、 部 分 截断 文件 等 ， 并 分 别 测试 了 在 块 对 齐 和 块 不 对 齐 两 种 情况 下 的 文件 重 写 和 截断 。 


通过 实验 显示 ， 在 采用 标准 的 YAFFs 的 设备 中 ， 虽 然 可 以 使 得 “被 删除 ”的 文件 数据 不 可 从 用 户 应 用 层 角 访问 ， 但 是 这 些 数据 仍 可 通过 提取 分 析 NAND 
Flash 的 物理 镜像 来 恢复 。 但 是 ， 采 用 改进 后 的 YAFFs 可 保证 文件 不 可 恢复 。 


8.3.2 ”基于 UBIFS 的 方案 


UBIFS 是 专门 针对 UBI 层 设计 的 ， 是 一 个 日 志 结 构 的 文件 系统 ， 不 支持 原 位 更 新 ， 所 以 UBIFS 不 提供 数据 安全 删除 的 功能 。 关 于 UBIFS 的 详细 介绍 请 参考 本 
书 第 6 章 。 


Reardon 等 人 在 现 有 的 UBIFS 中 增加 了 数据 安全 删除 的 功能 ， 形 成 数据 节点 加 密 文件 系统 (Data Node Encrypted File System，DNEFS) ， 把 这 种 机 制 
称 为 UBIFSec， 并 在 Android 智 能 手机 上 实现 了 DNEFS 的 运行 。 


DNEFS 将 NAND Flash 分 为 主 存储 区 (Main Storage Area) 和 密 钥 存储 区 (Key Storage Area，KSA) 。 主 存储 区 用 于 存放 加 密 数 据 ， 使 用 常规 的 日 志 
结构 的 文件 系统 (如 UBIFS) 管理 ,每 个 数据 节点 用 不 同 的 密 钥 加 密 ， 数 据 节 点 在 被 写 到 存储 介质 之 前 加 密 ， 解 密 后 被 读 出 。 


密 钥 存 在 专门 的 区 域 ， 即 密 钥 存 储 区 。 密 钥 存储 区 不 使 用 日 志 结 构 的 文件 系统 管理 ， 当 一 个 密 钥 存储 区 中 块 的 数据 被 更 新 时 ， 新 内 容 被 写 入 一 个 新 的 逻辑 
擦 除 块 ， 更 新 密 钥 存 储 区 相应 逻辑 块 的 映射 ， 然 后 擦 除 原 逻 辑 擦 除 块 所 对 应 的 物理 块 ， 实 现 密 钥 存 储 区 中 密 钥 的 安全 删除 。 
DNEFS 的 每 一 个 数据 节点 头 都 存储 着 其 对 应 的 密 钥 存 储 区 的 逻辑 位 置 。 密 钥 存 储 区 周期 性 地 执行 擦 除 操作 ， 以 安全 删除 被 更 新 数据 的 密 钥 。 所 


以 ，DNEFS 只 需 擦 除 少量 密 钥 存 储 区 中 的 块 就 可 以 达到 安全 删除 的 目的 。DNEFS 所 实现 的 安全 删除 ， 只 是 安全 删除 密 钥 存 储 区 中 过 时 的 密 钥 ; 而 主 存储 区 未 
使 用 安全 删除 机 制 ， 只 是 存储 加 密 的 数据 。 


值得 注意 的 是 ， 若 密 钥 存 储 区 中 的 块 在 擦 除 过 程 中 出 错 ， 成 为 坏 块 ， 这 可 能 导致 这 个 块 中 内 容 还 可 以 被 读 出 ， 但 是 不 可 以 删除 。 在 这 种 情况 下 ， 应 该 重新 
对 坏 块 中 的 数据 节点 进行 加 密 ， 并 执行 垃圾 回收 。 


结合 图 8-19 和 图 8-20， 介 绍 DNEFS 的 具体 写 操作 和 读 操作 过 程 。 当 DNEFS 执 行 写 操作 时 ， 图 8-19 中 表示 需 将 数据 节点 DN3 写 入 主 存储 区 。DNEFS 首 先 从 
密 钥 存储 区 (KSA) 中 选择 一 个 未 使 用 过 的 密 钥 Kk3， 然 后 用 k3 加 密 DN3， 将 密 文 Ek3 (DN3) 存 入 主 存储 区 中 ， 并 在 该 数据 节点 的 头 部 中 记录 其 密 钥 在 密 钥 存 
储 区 中 的 位 置信 息 。 





图 8-19 DENFS 写 操作 过 程 


当 DNEFS 执 行 读 操 作 时 ， 图 8-20 中 表示 需 将 数据 节点 DN1 从 主 存 储 区 中 读 出 。DNEFS 首 先 在 主 存储 区 中 读 出 密 文 Ek (DN1) ， 然 后 根据 该 数据 节点 头 
中 的 密 钥 位 置信 息 ， 从 密 钥 存储 区 中 读 出 其 对 应 的 密 钥 Kk1， 然 后 用 k1 进 行 解密 ， 得 到 DN1， 并 将 明文 读 出 。 






(1) 读 出 密 文 和 和 密 钥 位 置信 息 


(2) 读 出 密 钥 (3) 解密 和 读 出 明文 


图 8-20 ”DENFS 读 操作 过 程 


为 了 实现 数据 的 安全 删除 ， 必 须 在 密 钥 存 储 区 中 执行 周期 性 的 密 钥 删 除 操作 ，Reardon 等 人 也 将 此 称 为 Purging 操 作 。Purging 是 从 密 钥 存 储 区 中 周期 性 
地 删除 密 钥 的 过 程 ， 需 要 对 密 钥 存储 区 中 的 每 一 个 逻辑 擦 除 块 执行 该 操作 过 程 。 


结合 图 8-21 中 的 密 钥 状 态 图 (key state map) 介绍 一 下 Purging 的 操作 过 程 。 首 先 选 择 密 钥 存 储 区 中 的 一 个 逻辑 擦 除 块 作为 安全 删除 的 目标 逻辑 擦 除 
块 ， 并 准备 一 个 空间 的 逻辑 擦 除 块 。 所 选择 的 目标 逻辑 擦 除 块 中 的 密 钥 包 含 三 种 状态 : 正在 使 用 (used) 、 未 使 用 (unused) 和 被 更 新 (deleted) 。 接 下 
来 将 其 中 正在 使 用 的 密 钥 复 制 到 空 闪 逻辑 擦 除 块 的 相同 位 置 ， 如 图 8-21a 中 的 第 1[、3、5、6、7 个 密 钥 ， 因 为 其 对 应 的 数据 节操 头 中 已 记录 着 该 密 钥 在 密 钥 存 
储 区 中 的 逻辑 位 置 。 然 后 将 目标 逻辑 擦 除 块 中 的 其 他 密 钥 ， 包 括 未 使 用 的 密 钥 和 被 更 新 的 密 钥 ， 用 新 的 随机 数 奉 换 ， 写 入 新 的 逻辑 擦 除 块 中 ， 其 中 蔡 换 未 使 用 
的 密 钥 是 为 了 防止 敌手 提前 获得 密 钥 。 


最 后 将 合 有 旧 密 钥 的 逻辑 块 对 应 的 物理 块 擦 除 ， 实 现 将 无 用 的 数据 节点 的 密 钥 擦 除 ， 达 到 安全 删除 被 更 新 的 数据 节点 的 目的 。 
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a) 删除 密 钥 前 的 状态 b) 删除 密 钥 后 的 状态 
图 8-21 客 钥 状态 图 


DNEFS 实 现 了 只 需 擦 除 密 钥 存 储 区 (KSA) 中 的 少量 块 ， 通 过 删除 被 更 新 数据 的 密 铀 ， 达 到 安全 删除 数据 的 目的 。 所 以 ， 基 于 政 手 计算 能 力 有 限 的 假设 ， 
加 密 操作 可 以 有 效 地 减少 安全 删除 数据 所 需要 删除 的 NAND Flash 物 理 块 的 数量 。 


从 Purging 的 操作 过 程 可 以 看 出 ，DNEFS 必 须 具 有 直接 操作 逻辑 擦 除 块 所 对 应 的 物理 块 的 能 力 ， 所 以 PDNEFS 可 以 选择 直接 操作 raw NAND Flash 的 文件 系 
统 ， 如 UBIFS， 或 者 FTL。 但 是 ， 由 于 FTL 的 复杂 性 以 及 不 透明 性 ，DNEFS 选 择 了 基于 UBIFS 实 现 。Reardon 等 人 将 DNEFSs 的 思想 在 UBIFS 上 进行 了 实例 化 
(UBIFSec) 的 说 明 。 接 下 来 讲解 一 下 其 具体 的 实现 细节 。 


UBIFS 通 过 UBI 层 和 MTD 层 来 访问 具体 的 NAND Flash 物 理 块 。UBI 层 具有 使 用 均衡 的 功能 ， 可 以 有 效 地 保证 密 钥 存储 区 中 块 的 可 用 性 。 


UBIFS 的 数据 节点 的 大 小 是 4KB， 对 每 一 个 数据 节点 分 配 一 个 128 位 的 密 钥 ， 并 采用 AES 模 式 对 数据 节点 进行 加 解密 ， 由 于 每 个 密 钥 只 用 于 加 密 一 个 数据 节 
挟 ， 因 此 可 以 省 略 初 始 向 量 。 这 样 束 需 要 将 NAND Flash 存 储量 的 0.4% 容 量 作为 密 钥 人 存储 区 。 当 UBIFS 创 建 时 ， 由 硬件 随机 数 友 生 器 产生 随机 数 ， 保 存 到 密 钥 
存储 区 中 逻辑 探 除 块 所 对 应 的 物理 块 中 ， 并 标记 这 些 密 钥 为 未 使 用 状态 (unused) 。 


通过 对 比 测试 运行 未 修改 的 UBIFS 与 运行 修改 后 的 JUBIFS (UBIFSec) 的 设备 的 读 写 速度 ， 友 现 读数 据 的 速度 下 降 了 23%， 写 数据 的 速度 下 降 了 19%。 导 
致 速度 下 降 的 、 比 较 直 观 的 原因 是 : UBIFSec 需 要 执行 数据 加 解密 操作 ， 而 且 必 须要 增加 从 NAND Flash 中 读 写 密 钥 的 操作 。 为 了 验证 读 写 速度 下 降 的 主要 原 
因 是 由 加 解密 操作 市 来 的 ， 他 们 做 了 对 比 实验 ， 即 仍 正常 地 执行 密 钥 的 读 写 操作 ， 而 不 真正 执行 加 解密 操作 ， 验 证 实验 表明 此 时 原 UBIFSec 的 读 写 速度 回复 到 
了 与 原 UBIFS 的 水 平 。 


最 后 ， 总 结 一 下 UBIFSec 方 案 的 优点 : 
1) 数据 安全 删除 操作 延迟 有 确定 的 上 限 。 


2) 文件 可 以 实现 细 粒 度 删除 。 


3) 密 钥 存储 区 所 占用 的 NAND Flash 和 存储 容量 较 少 ， 且 只 需 在 密 钥 存 储 区 实现 安全 删除 ， 因 此 运行 高 效 。 


4) 易 被 整合 到 UBIFS 中 ， 且 对 现 有 的 Linux 内 核 中 UBIFS 的 应 用 不 必 做 任何 修改 。 注 意 ， 里 然 DNEFS 可 以 运行 到 YAFFS 中 ， 但 需要 做 较 大 的 修改 。 


8.4 应 用 层 方案 


由 于 应 用 层 只 能 与 兼容 POSIX 的 文件 系统 提供 接口 通信 ， 而 且 需 要 通过 文件 系统 层 、 驱 动 器 层 、 控 制 器 层 的 转换 才能 访问 最 底层 的 物理 介质 ， 所 以 在 应 用 
层 中 实现 数据 的 安全 删除 是 最 困难 的 ， 而 且 其 达到 的 安全 程度 也 是 最 低 的 。 


目前 ， 在 应 用 层 实现 的 数据 安全 删除 方案 大 多 数 面 向 支持 原 位 更 新 的 存储 介质 ， 比 如 磁盘 等 。Hughes 等 人 提供 了 一 个 应 用 程序 ， 通 过 调用 硬件 控制 器 接 
口上 提供 的 安全 删除 命令 (secure erase command) 安全 删除 物理 存储 介质 上 的 所 有 数据 。 很 多 用 户 级 别 的 文件 重 写 工具 (如 srm、wipe) 要 求 文件 系统 有 
以 下 功能 : 每 一 个 文件 块 都 必须 存在 已 知 的 位 置 ， 当 数据 块 更 新 时 所 有 的 原 数 据 被 新 数据 代 蔡 。 而 且 ， 重 写 工具 也 会 党 试 重 写 文 件 的 元 数据 ， 如 文件 名 、 文 件 
大 小 、 文 件 访问 时 间 等 ， 但 是 操作 系统 对 文件 系统 的 接口 可 能 不 允许 对 所 有 元 数据 进行 随意 修改 。 所 以 ， 此 类 方法 只 适用 于 支持 原 位 更 新 的 物理 存储 介质 ， 而 
不 适用 于 NAND Flash。 


对 于 在 应 用 层 中 针对 基于 NAND Flash 这 种 非 原 位 更 新 存储 介质 的 数据 安全 删除 方案 ， 最 有 效 的 方法 是 对 空 闪 区 域 填 序 ， 这 类 似 于 Reardon 等 人 针对 日 志 
陈 文 件 系统 YAFFs 提 出 的 用 户 应 用 级 方法 Purging 和 Balloning。 文 件 系统 中 含有 三 类 状态 的 数据 区 ， 即 含有 效 状 态 (valid) 数据 的 区 域 、 系 统 未 使 用 (free) 
的 区 域 和 已 被 更 新 (deleted) 区 域 (可 能 含有 目标 安全 删除 数据 ) 。 在 应 用 层 中 对 文件 系统 中 所 有 对 空 闪 区域 进行 填充 ， 束 是 对 free 区 域 和 deleted 区 域 进行 
数据 填充 ， 保 证 文件 系统 中 所 有 空 闪 区 域 不 再 含有 重要 信息 。 


接 下 来 根据 Zhang 等 人 提出 的 用 尸 级 数据 安全 删除 方案 进行 分 析 ， 他 们 是 针对 U 盘 而 设计 的 方案 ,但 是 可 以 推广 到 任何 基于 NAND Flash 的 存储 设备 。 
1) 创建 垃圾 文件 ， 用 垃圾 文件 填充 空 内 区 域 ， 直 到 所 有 空闲 区 域 都 被 填充 满 。 在 文件 系统 看 来 ， 这 些 垃圾 文件 对 用 户 也 是 有 用 的 。 
2) 在 文件 系统 层 删除 目标 文件 数据 及 其 元 数据 ， 包 括 文 件 名 、 文 件 大 小 等 ， 以 释放 目标 文件 所 占据 的 逻辑 空间 。 


3) 在 逻辑 层 中 用 随机 数 重 写 由 释放 目标 文件 所 得 到 的 逻辑 空间 ， 这 将 会 强制 控制 嚣 启动 垃圾 回收 荣 略 ， 对 目标 文件 所 鼎 据 的 物理 块 进行 回收 、 擦 除 操 
作 ， 确 保 物理 层 上 的 目标 文件 被 安全 删除 。 


4) 删除 垃圾 文件 。 


总 的 来 说 ， 在 应 用 层 中 对 空闲 区 域 进行 填 充实 现 数据 安全 删除 的 方案 有 很 明显 的 缺点 ， 因 为 其 带 来 的 系统 开销 正比 于 系统 空闲 区 域 的 大 小 ， 对 于 擦 写 寿 命 
有 限 的 NAND Flash， 这 将 会 导致 不 可 避免 的 破坏 。 


8.5 ” 跨 层 方案 


在 基于 NAND Flash 的 存储 系统 最 底层 ， 即 物理 介质 层 上 ， 实 现 数 据 的 安全 删除 是 最 简单 有 效 的 ， 但 是 最 底层 却 不 能 区 分 需要 安全 删除 目标 数据 的 位 置信 
息 ， 只 能 将 物理 介质 层 上 的 所 有 数据 都 删除 ， 灵 活性 较 差 ， 实 用 性 不 好 。 而 在 系统 的 高 层 ， 即 应 用 程序 层 或 者 文件 系统 层 ， 昌 然 可 以 区 分 目标 删除 数据 的 逻辑 
位 置信 息 ， 但 由 于 控制 器 层 和 驱动 层 的 不 透明 的 地 址 转化 ， 可 能 导致 目标 删除 数据 仍然 保存 在 物理 介质 上 。 所 以 ， 要 真正 地 实现 数据 的 安全 删除 ， 一 个 比较 好 
的 方法 丈 是 将 目标 删除 数据 的 位 置信 息 由 系统 高 层 向 系统 底层 逐 层 传 递 ， 进 行 有 效 的 安全 删除 。 


在 文件 系统 层 中 ， 从 一 个 文件 中 删除 数据 的 方式 有 三 种 : 删除 整个 文件 、 文 件 部 分 截 短 到 一 定 长 度 ， 以 及 更 新 文件 中 的 部 分 数据 。 但 是 ， 当 在 文件 系统 层 
删除 文件 时 ， 被 “删除 ”的 文件 数据 的 位 置信 息 只 有 文件 系统 知道 ， 而 只 有 在 用 新 的 数据 进行 重 写 “删除 ”的 文件 数据 所 占用 的 逻辑 地 址 的 时 候 ， 设 备 驱 动 层 
才 知 道 该 逻辑 地 址 中 对 应 的 数据 已 被 删除 或 更 新 。 


通常 有 两 种 由 文件 系统 层 向 设备 驱动 层 传递 被 删除 或 者 更 新 的 文件 数据 位 置信 息 的 方案 一 一 TRIM 命 令 和 TrueErase。 该 方案 通过 文件 系统 通知 驱动 层 哪些 
逻辑 块 含有 过 时 的 数据 ， 即 需要 被 安全 删除 的 目标 数据 ， 设 备 驱 动 层 利 用 这 些 信息 安全 删除 这 些 逻 辑 块 数据 ， 而 不 用 在 文件 系统 层 中 进行 数据 重 写 。 


1.TRIM 命 令 
Intel 公 司 发 布 的 固态 存储 驱动 白皮书 [23] 中 指出 ，TRIM 命 令 的 作用 是 通过 文件 系统 向 驱动 层 传递 哪些 逻辑 数据 块 中 含有 的 数据 已 经 过 时 。TRIM 命 令 不 是 


为 实现 安全 删除 实现 的 ， 而 是 为 了 优化 基于 NAND Flash 的 物理 介质 的 ， 因 为 如 果 没 有 TRIM 命 令 ， 设 备 驱 动 层 只 能 认为 正在 被 重 写 的 逻辑 块 是 需要 删除 的 
块 ， 这 将 对 NAND Flash 存 储 设备 的 效率 产生 较 大 的 影响 。 


Shah 等 人 分 析 了 在 固态 硬盘 (SSD) 中 正确 使 用 TRIM 命 令 来 安全 删除 文件 的 条 件 。 当 固态 硬盘 通过 USB 接 口 或 者 二 级 SATA 接 口 连接 主机 时 ，TRIM 不 能 
正常 地 工作 ， 而 只 有 固态 硬盘 通过 主 SATA 接 口 连接 主机 ， 而 且 在 固态 硬盘 上 运行 着 操作 系统 时 ，TRIM 才 能 正常 工作 。 他 们 同时 发 现 ， 各 种 固态 硬盘 启动 后 台 
垃圾 回收 的 速度 不 一 样 ， 有 的 甚至 在 删除 文件 大 约 150s 后 才 开始 执行 垃圾 回收 。 


通过 Shah 等 人 的 实验 结果 可 以 看 出 ， 依 靠 TRIM 命 令 来 实现 基于 NAND Flash 的 存储 设备 中 的 数据 安全 删除 也 不 是 一 定 有 效 的 ， 需 要 对 存储 设备 的 具体 应 


2.TrueErase 


Diesburg 等 人 提出 的 TrueErase 方 案 , 与 TRIM 命 令 的 功能 类 似 ， 即 通过 文件 系统 向 下 层 传递 过 时 的 数据 的 位 置信 息 。 但 是 TrueErase 方 案 与 TRIM 命 令 的 
区 别 是 ，TRIM 命 令 传递 的 是 所 有 过 时 的 数据 的 位 置信 息 ， 而 TrueErase 方 案 实现 了 只 传递 被 特别 标记 为 敏感 的 、 过 时 的 文件 所 在 位 置信 息 。 而 且 TrueErase 方 
案 对 设备 驱动 也 做 了 修改 ， 当 设备 驱动 接收 到 过 时 数据 的 位 置信 息 后 马上 利用 与 底层 物理 介质 的 接口 ， 执 行 敏感 数据 的 安全 删除 。 


TrueErase 方 案 可 以 实现 只 安全 删除 存 有 敏感 文件 的 块 ， 所 以 比 利 用 TRIM 命 令 来 实现 数据 的 安全 删除 更 加 有 效 。 
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第 9 重 ”仓储 数据 机 密 性 保护 


磁盘 丢失 、 被 盗 或 未 授权 的 使 用 而 造成 信息 和 数据 的 泄露 已 经 给 国家 、 企 业 和 个 人 融 来 了 难以 估量 的 损失 ， 严 峻 的 现实 同时 也 揭示 了 巨大 的 社会 需求 和 市 
场 价 值 。 数 据 加 密 技术 作为 解决 数据 存储 信息 安全 问题 最 直接 、 最 有 效 的 技术 之 一 ， 在 社会 和 市 场 的 推动 下 ， 近 几 年 得 到 了 长 足 的 发 展 。 在 新 的 操作 系统 中 ， 
硬盘 数据 加 密 开始 成 为 一 个 标准 组 件 。 目 前 致力 于 存储 安全 研究 的 机 构 主 要 有 可 信赖 计算 组 织 (TCG) 、 美 国电 气 电 子 工 程 师 学 会 (IEEE) 、 美 国 国家 标准 学 
会 (ANSI) 等 。 他 们 在 各 自 关 于 存储 安全 的 规 学 中 都 已 经 开始 包含 天 于 硬盘 加 密 的 算法 、 模 式 和 密 钥 管理 等 内 容 ， 其 中 最 具有 代表 性 的 是 IEEE 于 2008 年 4 月 
18 日 发 布 的 IEEE Std1619 一 2007 (Draft Standard for Cryptographic Protection of Data on Block-Oriented Storage Devices) ， 该 标准 中 公布 的 XTS- 
AES 模 式 被 认为 是 目前 最 适合 硬盘 加 密 的 窄 块 加 密 模式 。 在 9.1 节 中 ， 将 详细 介绍 XTS 的 工作 方式 和 特性 。 


针对 存储 数据 的 机 密 性 保护 ， 目 前 较 热 门 的 研究 方向 是 可 否认 加 密 ， 主 要 用 于 用 户 隐 私信 息 保护 。 可 否认 加 密 是 一 种 加 密 体制 ， 允 许 用 户 (消息 的 友 送 者 
或 接收 者 ) 否认 在 加 密 过 程 中 所 使 用 的 真实 参数 ， 而 给 出 一 个 假 的 参数 ， 但 是 强迫 攻击 者 不 能 党 察 出 这 种 欺骗 ， 在 认证 协议 、 组 密 钥 协 议 以 及 存储 数据 加 密 等 
方案 中 已 经 引起 了 很 大 的 关注 和 得 到 了 广泛 应 用 。 可 否认 的 认证 协议 能 够 使 得 接收 者 确定 给 定 消息 的 来 源 ， 但 是 不 能 向 第 三 方 证 明 发 送 者 的 身份 。9.2 节 将 从 
四 个 方面 切入 ， 详 细 介 绍 可 否认 认证 加 密 协 议 、 面 向 桌面 系统 的 可 人 否认 加 密 方案 、 面 向 移动 系统 的 可 否认 加 密 方案 和 面向 NAND Flash 的 可 否认 加 密 方案 。 


9.1 XTS-AES 


9.1.1 概述 


通常 ， 对 称 密码 体制 中 的 分 组 密码 算法 定义 了 电子 密码 本 (ECB) 模式 、 密 码 分 组 链接 (CBC) 模式 、 计 数 器 (CTR) 模式 和 输出 反馈 (OFB) 模式 ,但 
在 一 些 加 密 场 合 中 上 述 工作 模式 有 可 能 都 不 适用 ， 比 如 磁盘 扇 区 。 通 党 一 个 房 区 的 大 小 为 512 字 节 ， 磁 盘 加 密 直接 对 要 写 入 房 区 的 明文 进行 加 密 ， 记 录 在 磁盘 
扇 区 上 的 是 相对 应 的 密 文 。 当 要 读 取 某 一 扇 区 上 的 信息 时 ， 残 进行 解密 操作 ， 将 密 文 恢复 成 相应 的 明文 。 磁 盘 加 密 是 一 种 底层 的 加 密 ， 只 与 磁盘 的 格式 有 关 ， 
可 以 与 操作 系统 无 天 。 由 于 房 区 加 密 的 特殊 性 ， 通 常 的 加 密 方 案 是 不 适用 的 ， 原 因 是 它们 会 对 明文 有 所 扩张 ， 如 利用 AES 的 CBC 加 密 模 式 ， 密 文 包含 一 个 128 
位 的 初始 向 量 。 每 一 个 扇 区 通常 只 有 512 字 节 ， 如 果 利 用 AES-CBC 模 式 进 行 加 密 ， 就 必须 用 额外 的 扇 区 存储 初始 向 量 ， 这 样 不 但 造成 瀛 费 ， 而 且 明 文 和 密 文 在 
扇 区 上 的 存储 也 不 是 一 对 一 的 ， 给 底层 的 加 密实 现 带 来 很 多 不 便 。 


针对 磁盘 扇 区 加 密 的 特点 ，2002 年 Moses Liskov、Ronald L.Rivest 和 David Wagner 首次 提 到 了 可 调整 的 分 组 密码 (简称 可 调 分 组 密码 ) 概念 ， 同 传统 
的 分 组 密码 相 比 ， 除 了 密 铀 和 明文 这 两 个 输入 以 外 ， 可 调整 的 分 组 密码 多 了 一 个 输入 ， 这 个 输入 被 称 作 调整 值 (Tweak) 。Tweak 的 作用 类 似 于 CBC 模 式 中 的 
初始 向 量 和 OCB 模 式 中 的 Nonce。 引 入 这 个 调整 值 的 原因 是 在 一 般 情 况 下 ， 密 钥 的 改变 对 整个 加 密 系统 来 说 是 一 项 开销 很 大 的 事情 ， 所 以 在 保持 密 钥 不 变 的 情 
况 下 ， 通 过 改变 这 个 调整 值 ， 能 够 对 整个 加 密 系统 提供 多 变性 (variability) ， 相 比 于 改变 密 钥 来 说 ， 改 变调 整 值 对 整个 加 密 系统 开销 更 少 ， 并 且 没 有 任何 风 
险 ， 因 为 调整 值 可 以 公开 ， 而 不 用 担心 像 密 钥 那 样 存在 泄露 的 问题 。 对 于 不 同 的 TWeak， 可 调 分 组 密码 束 代 表 两 个 不 同 的 分 组 密码 ， 优 点 体现 在 改变 Tweak 比 
改变 密 钥 的 代价 更 小 ; 因为 改变 密 钥 束 意味 着 要 重新 进行 密 钥 扩 展 算 法 。 可 调 分 组 密码 的 作用 主要 体现 在 存储 加 密 ， 尤 其 是 磁盘 扇 区 加 密 。 目 前 国外 学 术 界 对 
可 调 分 组 密码 的 研究 已 有 一 些 成 果 。 为 了 标准 化 用 于 存储 加 密 的 密码 方案 ，IEEE 启 动 了 P1619 项 目 ， 其 中 的 一 个 标准 就 是 XTS-AES。 


XTS-AESs 算 法 主要 用 于 以 数据 单元 (包括 扇 区 、 逻 辑 磁 盘 块 等 ) 为 基础 结构 的 存储 设备 中 静止 状态 数据 的 加 密 ， 能 满足 高 性 能 RAID 应 用 、 固 态 硬 盘 驱动 
器 等 的 需要 ， 其 特点 是 : 


1) 磁盘 块 (如 一 个 扇 区 ) 分 成 多 个 密 文 块 (如 AES-128 的 128 位 ) 。 
2) 各 密 文 块 乙 间 独立 (没有 CBC 那 样 的 互相 依赖 ) 。 
3) 密 文 块 的 加 密 输入 包含 了 索引 信息 ( 扇 区 号 和 块 号 ) 。 


这 个 加 密 模 式 被 用 于 TrueCyrpt、OpenBSD/FreeBSD 的 磁盘 加 密 ， 以 及 Mac OS X 的 FileVault。XTS-AES 是 可 以 随机 访问 的 ， 其 加 密 解密 也 是 可 以 并 行 
化 的 ， 因 为 各 块 之 间 没 有 依赖 关系 (类 似 于 ECB 或 CTR 模 式 ) ， 这 也 是 TrueCrypt 一 直 强 调 的 可 以 实现 并 行 化 的 原因 所 在 。 


XTS-AES 在 处 理 过 程 中 首先 对 需要 处 理 的 数据 进行 分 组 ， 每 个 分 组 大 小 必须 是 128 位 ， 称 之 为 最 小 数据 单位 ， 并 分 别 对 每 个 数据 单元 进行 独立 的 处 理 ， 最 
小 数据 单元 之 间 都 是 独立 的 关系 ， 以 减少 整个 数据 处 理 之 间 的 联系 ， 利 用 可 调 分 组 密码 的 特点 通过 可 调 值 的 转换 在 不 需要 改变 密 钥 的 前 提 下 实现 每 128 位 数据 
加 密 / 解 密 所 用 的 数据 都 是 不 一 样 的 ， 提 高 了 整个 系统 的 灵活 性 。 通 常 ， 由 于 AES 加 密 系 统 的 实现 一 般 都 是 基于 流水 线 的 方式 执行 ， 这 样 的 方式 将 带 来 可 能 的 复 
制 - 粘 贴 攻 击 和 字典 式 攻击 ， 而 采用 XTS-AES 加 密 算 法 将 能 够 抵御 这 样 的 攻击 。 需 要 指出 的 是 XTS-AES 加 密 方式 是 一 种 长 度 固 定 的 加 密 /解密 方式 ， 即 输入 的 明 
文 和 输出 的 密 文 在 长 度 上 是 相等 的 。XTS-AES 的 这 些 特 点 使 得 整个 加 密 / 解 密 模块 能 够 很 方便 地 添加 到 现 有 的 存储 系统 中 ， 而 不 需要 改变 现 有 系统 中 的 结构 。 
在 基于 可 调 分 组 密码 的 XTS-AES 中 ， 可 以 用 tweak 即 可 调 值 来 映射 存储 数据 在 存储 介质 上 的 逻辑 位 置 。 


9.1.2 ”单个 128 位 数据 块 的 XTS-AES 加 密 


由 于 数据 流 的 XTS-AES 加 密 算法 是 以 128 位 的 数据 为 基本 处 理 单位 ， 所 以 对 于 一 连 串 的 数据 流 采 用 XTS-AES 进 行 加 密 的 时 候 ， 要 首先 对 数据 流 进 行 数据 分 


组 处 理 ， 然 后 再 分 别 对 每 个 分 组 数据 块 进行 加 密 ， 为 了 行文 方便 将 数据 流 的 XTS-AESj 加 /解密 记 作 xts-aes-enc/xts-aes-dec， 而 将 单个 128 位 的 分 块 数据 的 
XTS-AES 加 /解密 记 作 xts-aes-blockenc/xts-aes-blockdec， 所 以 首先 讲述 xts-aes-blockenc 的 加 解密 原理 。 


单个 128 位 数据 加 密 的 表达 式 为 式 (9-1) : 


C— XTS-AES-blockEnc(Key,P,i,) ( 9-1) 


其 中 Key 为 256 位 或 512 位 XTS-AES 加 密 密 钥 (两 个 128 位 Key 或 两 个 256 位 Key 之 和 ) ; P 为 128 位 明文 数据 块 ; 为 128 位 调整 值 ; j 为 128 位 数据 块 在 数据 单 
元 中 的 位 置 值 ;C 为 128 位 密 文 数据 块 。 


xts-aes-blockenc 的 结构 框图 可 以 表示 为 图 9-1。 
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图 9-1 单个 128 位 数据 块 的 xts-aes-blockenc 加 密 算 法 示意 图 
而 单个 128 位 数据 解密 的 表达 式 为 式 (9-2) : 
P—> XTS-AES-blockDec(Key,C,i,) (0 


xts-aes-blockdec 的 结构 框图 表示 为 图 9-2。 





图 9-2 单个 128 位 数据 块 的 xts-aes-blockdec 解 密 算 法 示意 图 


以 xts-aes-256 为 例 ， 在 表达 式 (9-1) 和 (9-2) 中 ，Key 为 912 位， 包含 了 两 个 部 分 即 Key=Key1||Key2， 其 中 Key1 用 于 数据 的 AES 加 解密 ，Key2 用 于 初 
始 tweak 值 的 加 解密 ，Key1 和 Key2 的 长 度 相 等 都 是 256 位 。 模 乘 操作 中 co 为 有 限 域 (2128) 中 对 应 于 多 项 式 x 的 本 原 。 加 密 计算 的 步骤 顺序 如 下 : 


1) T 一 AES Enc (Key2, i) @dl 
2) PP 一 P@GT 
3) CCTAES Enc (Key1, PP) 
4) C 一 CCGT 


其 中 的 模 乘 定义 如 下 : 调整 值 经 过 AEs 加 密 算法 得 到 的 密 文 被 转变 成 字 节 阵列 ao[k]，k=0，1，2，…，15， 经 过 与 c 的 j 次 方 模 乘 后 ， 得 到 的 字 节 阵列 为 


aj[k], k=0, 1, 2, ...，15, i 从 0 到 jj: 
air1[0]= (2 (ailolmod128) ) @ (135lail15]/128|) 
ai+1[k]= (2 (ailkJImod128) ) @®lailk-1]/128|, k=1, 2, ..., 15 


从 图 9-1 和 9-2 不 难看 出 ，xts-aes-blockenc 和 和 xts-aes-blockdec 的 整体 结构 大 致 相同 ， 不 同 的 只 是 调用 AES 加 密 子 程序 的 方式 不 同 ， 前 者 两 次 调用 AES- 
enc 加 密 程 序 ， 而 后 者 则 分 别 调 用 了 一 次 AES-enc 加 密 程序 和 一 次 AES-dec 解 密 程序 。 综 合 二 者 可 以 用 下 面 的 伪 C 代 码 简单 描述 xts-aes-blockenc 和 xts-aes- 
blockdec 的 结构 : 


xts-aes-blockenc/dec (key,message, tweak, out) 
begin 

key=keyl | key2; 

aes-enc (tweak, key2); 

mutiplyGF (2128) (tweak); 

xor (tweak,message); 

if (enc) 

aes-enc (message, key1) ; // 加 密 
if (dec) 


aes-dec (message, key1) ; // 解 密 
xor (tweak,message); 
out=message; 
end 


从 上 面 的 流程 图 和 伪 代 码 可 以 看 出 ， 除 了 输入 和 输出 的 混合 之 外 ， 主 要 就 是 调用 AES 加 解密 模块 和 基于 GF (2128) 上 的 域 乘 。 
9.1.3 ”数据 单元 的 XTS-AES 加 密 
数据 单元 的 XTS-AES 加 密 表达 式 可 以 表示 为 式 (9-3) 。 
C— XTS-AES-Enc(Key,P,i) (9-3 ) 
其 中 : Key 为 XTS-AES 密 钥 ; P 为 待 加 密 的 数据 单元 明文 ; 为 128 位 的 调整 值 (tweak) ; C 为 加 密 后 所 得 到 的 数据 单元 密 文 。 
而 数据 单元 的 XTS-AES 解 密 同样 可 以 用 表达 式 (9-4) 表示 。 


P— XTS-AES-Dec(Key,C.,7) ( 9-4 ) 


以 xts-aes-256 为 例 ， 数 据 单元 的 XTS-AES 加 /解密 过 程 包 括 数 据 分 组 和 xts-aes-blockenc/xts-aes-blockdec 两 个 部 分 ， 如 图 9-3 所 示 。 
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图 9-3 ”xts-aes-256 加 密 / 解 帘 框 图 


数据 分 组 是 XTS-AES 操 作 的 第 一 步 ， 对 于 长 度 大 于 128 位 的 数据 ， 必 须 将 其 分 割 为 不 同 的 分 组 。 以 明文 P 为 例 ， 必 须 将 P 分 为 m+1 个 块 ， 即 令 P=PolP1| 
.|Pm_1|Pm， 其 中 m 为 不 超过 明文 长 度 L 除 以 128 的 最 大 整数 ， 即 m=[L/128]。 对 于 这 个 分 组 ， 必 须 明确 的 是 Po、P1、.…、Pm_1 的 长 度 必须 精确 为 128 位 ， 而 最 
后 一 个 分 组 块 Pn 的 长 度 则 可 以 是 0 ~ 127 位 中 的 任意 一 个 值 ， 包 括 0 和 127， 即 允许 最 后 一 个 分 组 块 Pm 是 空 的 ,但 是 不 能 是 128 位 长 度 。 由 于 对 数据 流 分 组 所 导 
致 的 Pm 的 长 度 有 可 能 不 是 128 位 ， 所 以 在 对 这 些 数据 进行 XTS-AES 处 理 时 ， 会 分 为 两 种 情况 考虑 ， 对 应 的 在 xts-aes-blockenc 中 的 处 理 方式 是 不 一 样 的 。 在 数 
据 分 组 中 除了 完成 数据 块 分 割 的 任务 之 外 ， 还 要 完成 输出 每 个 Pj 在 数据 流 中 的 位 置 ， 即 用 表征 每 个 分 组 块 在 数据 流 中 的 位 置 。 

对 于 数据 单元 的 分 组 中 ， 人 允许 最 后 一 个 分 组 的 长 度 不 是 128 位 ， 但 是 这 时 处 理 的 流程 会 不 同 。 对 于 数据 流 P=PolP1|.…|Pm-2z|Pm-1IPm， 当 Pm 的 长 度 不 是 
128 位 或 者 0 位 时 ， 进 行 XTS-AES 加 密 的 步骤 如 下 : 

. 对 PU，P1，.…，P， > 这 m-1 个 128 位 数据 块 按照 XTS-AES-blockEnc 的 方式 正常 加 密 ， 得 到 密 文 组 CO0，C1，C?，…，C >。 


计算 数据 块 Pu 的 长 度 ， 设 其 大 小 为 b， 首 先 对 数据 块 Pu.1 进 行 XITS-AES-blockEnc 加 密 得 到 窗 文 CC， 取 CC 的 前 b 个 位 作为 窗 文 输出 的 Cm。 


: 记 CC 剩 下 的 后 (128-b) 个 位 数据 为 CP， 将 数据 块 分 组 P, 作为 高 位 与 CP 串 接 ， 即 记 PP=P，|CP， 由 于 PP 正好 是 128 位 ， 故 按照 XTS-AES-blockEnc 加 密 之 


后 的 密 文 记 为 C1。 
` 最 终 输 出 的 密 文 就 是 C=Co|C1|…Cy2|Cwmi1|Cmo 


其 中 XTS-AES-blockEnc 为 单个 128 位 数据 块 的 XTS-AES 加 密 算法 ， 经 过 这 样 一 个 变换 ， 整 个 数据 单元 中 的 明文 全 部 被 加 密 成 为 等 长 度 的 密 文 ， 其 中 当 


b# 0 时 ， 没 有 采取 通 音 的 补 零 方法 ， 而 是 采用 了 密 文 窃取 (CTS) 模式 ， 算 法 如 图 9-4 所 示 ( 当 b#0 时 最 后 两 个 数据 块 分 组 Pm-1 和 Pm 加 密 过 程 ) 。 
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图 9-4 ”最 后 两 个 数据 单元 处 理 流程 ( 密 文 窃取 模式 示意 图 ) 
整个 数据 块 (data-unit) 的 XTS-AES 加 密 流 程 用 伪 C 代 码 简 单 描述 如 下 。 


XTS-AES (Key, P, i) 

begin 
P=PO | Pl1 | P21|...| Pm-2 | Pm-1 |Pm 
for (gq=0; q<=m-2; q++) 

Cq=XTS-AES-blockEnc (Key Pa i,9) 

b=bit size of (Pm) 
if (b=0)then do 
{ 
Cm-1=XTS-AES-blockEnc (Key Pm-1,1,m-1) 
Cm=empty 

} 

else do 

{ 
CC=XTS-AES-blockEnc (Key, Pm-1,1,m-1) 
Cm=the first b bits of CC 
CP=the last (128-b) bits of CC 
PP=Pm| CP 
Cm-1=XTS-AES-blockEnc (Key, PP, 1,m) 


} 
C=C0 | C1 |...| Cm-1 |Cm 
end 


对 于 data-unit 的 解密 沅 程 与 加 密 流程 基本 一 致 ， 故 不 再 作 详细 摘 述 。 
9.1.4 XTS-AES 的 工作 模式 


XTS-AES 仍 然 是 分 组 密码 性 质 的 ， 而 分 组 密码 的 工作 模式 的 选择 是 一 项 使 算法 适应 具体 应 用 的 技术， 必须 重视 工作 模式 。 其 常见 的 工作 模式 如 表 9-1 所 


小 \。 


表 9-1 分 组 窗 码 的 工作 模式 


模 式 描 述 典型 应 用 





电子 密码 本 (ECB) 用 相同 的 密 钥 分 别 对 明文 加 密 单个 数据 的 安全 传输 (如 一 个 加 密 密 铀 ) 
加 密 算 法 的 输入 是 上 一 个 密 文 组 和 下 _ 

密码 分 组 链接 认证 ， 普 通 目的 的 面向 分 组 的 传输 

党 公分 组 链接 〈CBC) 一 个 明文 组 的 异 或 认证 ， 普 通 目的 的 面 回 分 组 的 传输 
一 次 处 理 7 位， 上 一 组 密 文 作为 加 密 算 

密码 反馈 (CFB) 法 的 输入 ， 与 本 次 的 明文 分 组 进行 异 或 认证 ， 普 通 目的 的 面 癌 分 组 的 传输 


生成 本 组 密 文 

与 CFB 基本 相同 ， 只 是 加 密 算 法 的 输 
入 是 上 一 次 加 密 的 输出 

每 个 明文 分 组 都 与 一 个 加 密 计 数 器 相 


输出 反馈 (OFB) 卫星 通信 





计数 器 (CTR) 普通 目的 的 面向 分 组 的 传输 和 高 速 需求 


异 或 。 对 每 个 后 续 分 组 计数 器 圳 增 





出 于 安全 性 考虑 ， 在 P169 协 议 中 明确 规定 了 XTS-AES 中 不 能 够 采取 计数 器 模式 和 密码 分 组 链接 模式 来 执行 ， 而 建议 使 用 ECB 模 式 。 采 用 XTS-AES 后 ,及 用 
的 初始 密 钥 昌 然 是 一 样 的 ， 但 是 真正 对 明文 进行 加 密 的 初始 密 钥 ( 密 钥 扩展 之 前 ) 是 不 一 样 的 ， 从 这 个 意义 上 讲 ， 也 是 对 ECB 模 式 的 一 种 改进 。 


9.2 可 否认 加 密 


随 着 互联 网 技术 的 迅速 友 展 ， 社 会 信息 化 程度 逐渐 提高 ， 日 常生 活 中 的 一 些 常 见 的 活动 逐渐 在 网 络 中 得 到 了 应 用 ， 如 网 上 谈判 、 电 子 选举 、 电 子 商 务 等 。 
与 日 常生 活 中 的 常见 活动 一 样 ， 这 些 在 网 络 中 的 活动 也 需要 得 到 认证 与 保护 。 


考虑 一 种 情况 : 顾客 通过 互联 网 向 销售 商 订货 ， 发 送 消息 (如 报价 、 订 单 量 等 ) ， 顾 客 希 望 销 售 商 可 以 验证 消息 来 源 的 正确 性 ， 但 是 不 希望 销售 商 将 消息 
泄露 给 第 三 方 。 因 此 ， 融 诞生 了 一 种 特殊 的 网 络 需要 ， 即 消息 的 上 友 送 方 希 望 将 消息 友人 送 给 接收 方 ， 接 收 方 可 以 确认 消息 的 来 源 ， 但 是 接收 方 不 能 将 消息 泄露 给 
第 三 方 ， 或 者 说 接收 方 不 能 向 第 三 方 证 明 消 息 来 源 的 真实 性 。 为 了 满足 上 述 类 似 的 需要 ， 提 出 了 可 否认 的 认证 协议 。 可 否认 的 认证 协议 是 指 接收 者 能 够 辨别 出 
某 个 消息 的 发 送 者 的 身份 ， 但 是 第 三 者 不 会 知道 消息 友 送 者 的 身份 的 一 类 协议 。 


再 考虑 一 种 情况 : 在 电子 选举 过 程 中 ， 假 设 第 三 方 强迫 选举 者 Bob 必 须 选 择 某 一 个 候选 人 C， 但 是 Bob 不 想 选 择 他 ， 并 且 Bob 不 想 让 第 三 方 知道 他 没有 选 
择 第 三 方 所 要 求 的 候选 人 。Bob 向 计 票 机 构 Alice 发 送 他 的 选择 A 以 及 A 的 证 明 ， 从 而 使 Alice 知 道 A 来 自 于 Bob 而 不 是 其 他 人 ;同时 Bob 希 望 Alice 不 能 向 第 三 方 
证 明 A 来 自 于 Bob， 于 是 第 三 方 不 能 强 担 Bob 来 选择 他 预先 决定 的 候选 人 ， 因 为 Bob 完 全 可 以 否认 是 他 发 送 的 A， 从 而 保证 了 选举 的 公平 性 。Bob 向 计 票 机 构 
Alice 发 送 他 的 选择 A 以 及 A 的 证 明 ， 并 且 向 第 三 方 否认 是 他 发 送 的 A， 可 以 通过 可 否认 的 协议 实现 。 但 是 ，Bob 无 法 向 第 三 方 证 明 选 择 了 第 三 方 指定 的 那个 候选 
人 C， 仍然 可 能 受到 第 三 方 的 胁迫 。 显 然 ， 运 用 传统 的 加 密 方 案 或 扩 术 发 送 消 息 无 法 解决 上 述 问 题 。 


在 数据 存储 方面 ， 现 实生 活 中 也 有 类 似 的 需求 。 比 如 人 权 记 者 在 通过 某 些 政 对 国家 的 边境 检查 站 时 ， 会 被 强制 要 求解 密 存 储 设备 中 已 加 密 的 数据 ， 只 有 数 
据 被 解密 并 被 检查 后 才 会 被 放行 。2012 年 ， 一 个 电视 录像 制作 人 在 叙利亚 收集 了 一 些 违 反 人 权 的 证 据 ， 并 试图 将 这 些 视频 资料 读 离 叙利亚 ， 而 他 缺乏 任何 数据 
保护 机 制 ， 因 而 他 只 好 将 资料 保存 在 一 个 SD 卡 中 ， 并 将 SD 卡 隐 藏 在 手 辟 上 的 一 个 伤口 中 。 因 而 ， 在 这 种 情况 下 ， 传 统 的 加 密 方案 或 扩 术 也 无 法 起 到 保护 机 密 
数据 的 作用 ， 从 而 需要 一 种 可 以 隐藏 加 密 数据 的 技术 。 


为 了 解决 上 述 两 个 问题 ， 可 人 否认 加 密 (Plausibly Deniable Encryption，PDE) 的 概念 应 运 而 生 。 可 否认 加 密 是 一 种 加 密 体制 ， 能 够 使 消息 的 及 送 者 (或 
接收 者 或 双方 ) 否定 在 加 密 过 程 中 所 使 用 的 真实 参数 ， 而 给 出 一 个 假 的 参数 ， 并 且 让 敌手 不 能 党 察 。 在 传统 的 加 密 方案 中 ， 通 常 考虑 的 敌手 类 型 是 被 动 地 穷 
听 ， 主 动 地 改变 、 伪 造 、 复 制 、 删 除 或 注入 消息 等 ， 甚 至 会 与 消息 的 友 送 者 或 接收 者 通信 ， 提 出 各 种 询问 ， 以 获取 对 其 有 用 的 信息 ， 并 假设 他 们 不 会 强 担 消息 
的 发送 者 或 接收 者 做 任何 事情 。 但 是 ， 面 对 强制 型 敌手 ， 敌 手 会 强迫 消息 的 友 送 者 或 接收 者 给 出 消息 或 用 于 产生 密 文 的 真实 参数 ， 甚 至 是 加 密 密 钥 。 因 此 ， 面 
对 强制 型 敌手 的 胁 旬 ， 为 了 欺骗 政 手 ， 又 让 敌手 不 能 党 察 出 这 种 欺骗 ， 束 需要 运用 可 否认 加 密 技术 。 


本 章 首先 简单 介绍 近年 来 学 术 界 提出 的 多 种 可 否认 加 密 与 认证 协议 方案 ,然后 根据 面向 系统 平台 的 不 同 ， 着 重 介绍 可 否认 加 密 技术 在 数据 存储 方面 ， 尤 其 
是 固态 仓储 设备 上 的 各 种 应 用 方案 。 


9.2.1 ”可 否认 加 密 与 认证 协议 简介 


1998 年 ，Canetti 等 人 首先 提出 了 可 否认 加 密 的 概念 ， 对 可 否认 加 密 最 初 的 定义 是 : 对 于 敌手 的 胁 旭 ， 如 果 消 息 的 友 送 者 能 够 伪造 假 的 随机 参数 ， 使 得 密 
文 看 起 来 像 是 对 另 一 个 明文 消息 的 加 密 ， 而 真正 的 明文 消息 不 会 泄露 ， 融 称 为 友 送 者 可 否认 的 加 密 方案 。 对 于 消息 的 接收 者 也 有 类 似 的 定义 。 他 们 注意 到 一 类 
针对 加 密 系统 的 攻击 ， 在 这 类 攻击 下， 敌手 可 以 强迫 密 文 友 送 者 或 接收 者 公开 加 密 的 明文 和 辅助 随机 数 。 根 据 受 胁 迫 攻 击 的 对 象 ， 可 把 可 否认 加 密 方 案 分 为 三 
类 ， 第 一 类 是 发 送 者 可 否认 加 密 方案 ， 用 于 抵抗 对 消息 友 送 者 的 胁 担 ， 如 敌手 要 求 看 到 秘密 的 数据 ;第 二 类 是 接收 者 可 否认 加 密 方案 ; 第 三 类 是 消息 的 发 送 者 


和 接收 者 都 可 否认 的 加 密 方案 。 根 据 密 钥 的 使 用 情况 ， 又 分 为 共享 密 钥 的 可 否认 加 密 方案 和 公 钥 可 否认 加 密 方案 。 


在 强 可 否认 模型 下 ，Canetti 等 人 给 出 了 可 否认 加 密 的 一 种 构造 ， 他 们 提出 的 可 人 否认 加 密 方 案 是 针对 1 位 消息 的 加 密 ， 也 提 到 了 对 多 位 消息 的 加 密 ， 但 需要 
多 次 加 密 ， 导 致 方案 不 实用 ， 可 否认 性 较 低 ， 具 有 很 大 的 明 密 文 扩张 率 〈 即 密 文 和 明文 长 度 的 比率 ， 该 比率 应 越 小 越 好 ) 和 被 检 出 率 (被 政 手 检测 出 欺骗 的 概 
率 ， 该 概率 应 越 小 越 好 ) ， 导 致 他 们 的 构造 出 错 的 概率 较 大 。 


在 Canetti 等 人 首次 提出 可 否认 加 密 概 念 之 后 的 10 年 多 的 时 间 里 ， 可 否认 加 密 一 直 没 有 得 到 发 展 ， 直 到 2008 年 ，Marek Klonowski 等 人 在 Canetti 等 人 的 
方案 基础 上 ， 提 出 了 一 个 基于 ElGamal 的 加 密 方案 ， 这 个 方案 的 本 质 构 造 与 Canetti 方 案 一 样 ， 发 送 者 和 接收 者 之 间 需 要 共享 一 个 密 钥 ， 可 否认 性 有 所 提高 ， 
但 密 文 长 度 方面 没有 大 大 改进 ， 也 不 是 很 实用 。 


2009 年 Maged 等 人 提出 了 两 种 方案 ， 这 两 个 方案 被 认为 是 具有 里 程 碑 意义 的 方案 。 参 考 文 献 基 于 MPKI (mediated PKI) ， 使 用 了 不 经 意 传输 (OT) 协 
议 ， 这 个 方案 在 加 密 前 不 需要 在 发 送 者 和 接收 者 之 间 发 送 任何 额外 的 消息 ， 可 以 一 次 性 完成 可 否认 加 密 。 发 送 者 和 接收 者 之 间 不 需要 共享 密 钥 ， 密 文 解密 成 明 
文 消息 后 没有 错误 ， 相 对 于 以 前 的 方案 其 市 宽 ( 密 文 长 度 ) 有 一 定 提高 。 但 是 本 方案 需要 一 个 第 三 方 ， 提 到 的 多 位 信息 可 否认 加 密 需要 多 次 重复 执行 不 经 意 传 
输 协 议 ， 所 以 既 不 通用 ， 效 率 也 不 局 。 参 考 文献 主要 考虑 的 是 可 否认 性 ， 对 于 安全 性 考虑 的 不 是 很 多 ， 提 出 的 方案 不 能 抵抗 选择 密 文 攻击 (CCA) ， 只 简要 地 
分 析 了 抵抗 选择 明文 攻击 (CPA) 的 安全 性 ,没有 进行 安全 性 证 明 。 同 时 文献 也 引入 了 发 送 者 可 否认 的 公 钥 加 密 方案 ,实际 上 是 三 个 方案 ， 第 一 个 方案 是 一 个 
1 位 消息 的 可 否认 加 密 方 案 ， 实际 上 是 Canetti 等 人 构造 的 一 个 具体 实现 ， 第 二 个 和 第 三 个 方案 是 对 多 位 消息 进行 可 否认 加 密 的 方案 ， 第 二 个 方案 实际 上 是 第 三 
个 方案 的 引入 。 


在 学 术 界 ， 可 否认 认证 协议 研究 也 有 很 大 的 友 展 。 在 交互 式 的 可 否认 认证 协议 方面 ，1998 年 Dwork 等 人 提出 了 一 个 基于 零 知 识 证 明 的 可 否认 认证 协议 ， 
这 个 方案 有 时 间 限 制 ， 认 证 过 程 有 时 间 延 时 。 随 后 ，Aumann 等 人 提出 基于 大 数 分 解 的 可 否认 认证 协议 ， 在 这 类 协议 中 共有 3 个 参与 方 : 友 送 者 S、 接 收 者 R 以 
及 一 个 询问 者 INQ。S 和 R 通 过 一 个 不 安全 的 信道 进行 通信 ，INQ 位 于 S 和 R 之 间 截 取 他 们 之 间 的 信息 并 且 加 入 上 自己 的 信息 。 在 这 里 监听 R 和 S 之 间 的 通信 假定 是 
不 能 分 辨 出 Ss 的 身份 。 这 种 方法 假定 了 一 个 公开 目录 ， 并 且 是 保证 安全 的 。 


在 非 交 互 式 的 可 否认 认证 协议 方面 ，2004 年 Shao Zu-hua 提 出 了 一 个 基于 广义 El Gamal 签 名 体制 的 可 否认 认证 协议 。2005 年 Lu Rong-xing 等 人 提出 了 一 
个 基于 双 线 性 对 与 一 个 基于 大 数 分 解 的 非 交 互 式 可 否认 认证 方案 。2011 年 3 月 ， 张 雅 哲 等 人 给 出 了 一 个 可 否认 的 组 密 钥 协商 协议 的 一 般 化 构造 方式 ， 使 用 了 一 
个 编译 器 ， 并 给 出 了 该 编译 器 的 构造 方式 ， 这 个 编译 器 可 以 将 一 个 普通 的 非 认证 的 组 密 钥 协商 协议 转化 为 可 否认 的 组 密 钥 协 商 协 议 ， 转 化 后 的 协议 仅 比 原来 的 
协议 增加 了 两 轮 数 据 广播 和 一 轮 数 据 验 证 。 


忌 的 来 说 ， 可 否认 加 密 允 许 使 用 者 以 两 种 以 上 的 方法 来 加 密 文 件 ， 能 够 使 消息 的 友 送 者 (接收 者 ) 隐藏 或 否认 机 密 内 容 的 存在 ， 在 消息 的 友 送 者 (接收 


者 ) 受到 强迫 攻击 时 ， 能 够 向 强制 型 敌手 提供 假 的 消息 或 参数 ， 隐 瞒 真 实 的 消息 或 参数 ， 而 使 得 敌手 无 法 察 况 ， 从 而 摆脱 敌手 的 攻击 ， 确 保 加 密 的 可 靠 性 。 


9.2.2 面向 桌面 系统 的 可 人 否认 加 密 方案 


将 可 否认 加 密 技术 应 用 于 数据 加 密 人 存储 ， 可 以 简化 为 : 使 用 不 同 的 密 铀 ， 从 得 到 的 密 文 中 可 以 产生 不 同 的 合理 的 明文 。 用 户 想 要 隐藏 的 明文 用 真正 的 密 钥 
加 密 ， 而 用 于 欺骗 敌手 、 可 以 公开 的 明文 ， 使 用 “诱饵 密 铀 ”加 密 。 当 面 对 强 制 型 敌手 时 ， 用 户 只 提供 “诱饵 密 铀 ”， 使 得 政 手 获得 合理 的 、 可 公开 的 数据 ， 
而 不 会 友 现 用 户 和 要 隐藏 的 秘密 数据 ， 从 而 使 得 用 户 逃 脱 强 制 型 敌手 的 胁 提 。 


在 数据 存储 加 密 方面 ， 一 般 有 两 种 类 型 的 可 否认 加 密 方案 ， 第 一 种 方案 是 基于 隐 写 术 (Steganography) ， 第 二 种 是 基于 隐藏 卷 (Hidden Volume) 技 
术 。 


1. 基 于 隐 写 术 的 昌 面 系统 方案 


1998 年 ，Anderson 等 人 首先 提出 了 第 一 个 文 持 可 人 否认 加 密 的 文件 加 密 机 制 ， 他 们 介绍 了 两 个 方案 。 第 一 个 方案 是 假设 收 手 不 知道 文件 明文 的 任何 信息 ， 
首先 用 随机 数 产生 一 系列 的 载体 文件 ， 然 后 将 要 隐藏 的 文件 “ 异 或 ”上 一 组 载体 文件 。 通 过 用 户口 令 和 要 隐藏 的 文件 的 文件 名 来 确定 所 使 用 的 目标 载体 文件 。 
但 是 ， 这 个 方案 需要 大 量 的 载体 文件 ( 约 1000 个 ) ， 并 且 为 了 适应 要 隐藏 的 文件 的 长 度 ， 这 些 载体 文件 必须 足够 大 。 第 二 个 方案 是 首先 将 存储 介质 (如 磁盘 ) 
填 满 随机 数 ， 然 后 利用 用 户口 令 以 及 要 隐藏 的 文件 的 文件 名 ， 通 过 散 列 算法 产生 要 隐藏 的 文件 存放 在 存储 介质 中 的 起 始 位 置 ， 以 及 加 密 所 使 用 的 密 钥 ， 从 而 使 
得 敌手 无 法 区 分 随机 数 和 隐藏 的 文件 。 但 是 ， 这 个 方案 的 缺点 在 于 文件 碰撞 的 概率 较 大 ， 而 且 无 效 利用 的 存储 空间 大 ， 造 成 了 较 大 的 系统 |/O 开 销 。 


1999 年 ，McDonald 等 人 提出 了 另外 一 个 可 否认 加 密 方案 StegFS。 他 们 基于 EXT2 文 件 系 统 ， 利 用 文献 [11] 中 的 第 二 个 方案 ,设置 了 多 个 安全 级 别 (最 多 
15 个 ) ， 每 一 个 级 别 使 用 一 个 特定 的 密 钥 ， 同 时 采用 一 个 存储 于 非 可 否认 的 存储 空间 中 的 块 分 配 表 ， 这 个 表 中 存储 着 系统 所 使 用 的 每 个 块 的 入 口 信息 。 若 某 一 
个 级 别 关 闭 时 ， 则 无 法 防止 该 级 别 中 的 块 被 重 写 ， 因 此 需 增加 宛 余 块 来 防止 碰撞 。 这 个 方案 基于 系统 仓 企 多 个 安全 级 别 ， 而 不 是 否认 要 隐藏 文件 的 存 任 。 这 个 
方案 修改 了 EXT2 文 件 系统 的 驱动 ， 以 及 块 分 配 表 的 存在 都 暴露 了 可 否认 加 密 技术 的 使 用 。 这 个 方案 导致 只 有 6% 的 系统 空间 可 以 真正 用 于 存储 文件 ， 其 余 的 空 
间 要 用 来 存储 元 数据 以 用 于 防止 文件 碰撞 。 


2003 年 ，Pang 等 人 也 提出 了 一 个 称 为 stegFs 的 方案 。 他 们 使 用 未 加 密 的 全 局 位 图 来 标记 要 隐藏 文件 所 占用 的 块 ， 并 将 这 些 块 标记 为 “已 用 ”， 以 此 保证 
要 隐藏 的 文件 不 被 占用 。 因 为 不 需要 仓储 一 个 块 的 多 个 备份 ， 这 样 束 缓解 了 可 否认 加 密 方案 的 数据 覆盖 问题 ， 减 小 了 系统 的 MO 开 销 。 但 是 ， 由 于 一 些 被 系统 


标记 为 已 用 的 块 ， 却 在 系统 的 节点 表 (inode table) 中 没有 对 应 的 目录 记录 ， 从 而 政 手 可 推测 出 隐藏 文件 的 存在 ， 以 及 隐藏 文件 所 占用 空间 的 大 小 。 该 方案 
同时 也 提出 了 三 个 改进 的 措施 : 第 一 个 是 将 一 些 空 块 或 者 废弃 块 也 标记 为 已 用 ;第 二 个 是 当 创建 隐藏 文件 时 ， 同 时 分 配 一 些 虚 拟 块 ， 这 些 虚 拟 块 并 没有 存储 文 
件数 据 ; 第 三 个 是 系统 周期 性 地 在 后 台 创 建 、 更 新 虚拟 隐藏 文件 ， 防 止 敌 手 找 出 隐藏 文件 所 真正 使 用 的 块 。 以 上 三 个 改进 措施 只 是 使 政 手 更 难 确 定 出 隐藏 文件 
所 真正 使 用 的 块 ， 但 导致 存储 空间 利用 率 低 。 本 方案 的 可 否认 性 基于 敌手 虽然 知道 存在 隐藏 的 文件 ， 但 是 政 手 不 知道 隐藏 文件 的 多 少 。 


忌 的 来 说 ， 上 述 基 于 隐 写 术 的 可 否认 加 密 方案 普遍 存在 的 缺点 是 : 存储 空间 利用 率 低 ; 数据 覆 苹 现象 严重 ;系统 |/O 开 销 增 大 。 这 使 得 上 述 方案 在 性 能 要 
求 高 、 存 储 空间 有 限 的 移动 系统 中 不 适用 。 


2. 基 于 隐藏 卷 技 术 的 桌面 系统 方案 


隐藏 卷 的 基本 原理 是 系统 首先 在 所 有 逻辑 地 址 (LBA) 空间 上 建立 一 个 逻辑 分 区 ， 作 为 公开 分 区 ， 然 后 以 某 个 较 靠 后 的 逻辑 地 址 为 起 始 地 址 ， 再 次 建立 一 
个 逻辑 分 区 ， 将 第 二 个 分 区 作为 隐藏 分 区 。 由 于 隐藏 分 区 的 逻辑 地 址 空间 是 公开 分 区 的 一 部 分 ， 因 此 基于 隐藏 卷 的 可 人 否认 加 密 方案 不 可 避免 地 会 产生 数据 禾 兰 


TrueCrypt 各 FreeOTFE 是 在 桌面 系统 中 ， 基 于 隐藏 卷 的 可 否认 加 密 的 具有 代表 性 的 方案 。 由 于 前 者 应 用 更 加 广泛 ， 接 下 来 主要 介绍 TrueCrypt 方 案 。 
TrueCrypt 在 加 载 隐 藏 分 区 文件 前 需要 通过 用 户 的 口令 进行 认证 ， 以 便 保 证 虚拟 磁盘 上 数据 的 人 存储 安全 。 隐 藏 分 区 文件 的 口令 认证 流程 是 : 


1) 读 取 分 区 文件 头 字 世 数据 到 内 人 存 中 ， 记 为 VolumeHeader。 其 中 前 64 字 节 数 据 不 加 密 的 盐 ， 其 余数 据 均 进行 加 密 。 该 盐 值 用 于 对 用 户口 令 进行 变换 ， 
以 生成 用 于 加 解密 隐藏 分 区 文件 头 的 导出 密 钥 。 


2) 从 文件 结尾 倒数 第 1536 字 节 处 读 取 ?512 字 节 数 据 ， 记 为 HiddenHeader。 如 果 该 外 部 分 区 含有 隐藏 分 区 ， 则 该 处 ?512 字 节 融 是 隐藏 分 区 的 文件 头 。 隐 藏 
分 区 的 头 部 格式 与 外 部 分 区 相同 ， 前 64 字 节 数 据 为 不 加 密 的 盐 ， 其 余数 据 均 加 密 。 


3) 根据 用 户 输入 的 口令 和 盐 通过 密 钥 生 成 算法 (PBKDF2) 生成 导出 密 钥 后 ， 用 LRW 模 式 解密 内 和 存 数据 VolumeHeader。 分 区 文件 头 ?12 字 节 数 据 中 除了 
盐 均 为 加 密 数据 ， 没 有 出 现 用 尸 所 选 数字 摘要 算法 和 数据 加 密 算法 的 算法 标识 ， 而 且 密 钥 生 成 算法 依赖 于 创建 分 区 时 用 户 所 选择 的 数字 摘要 算法 。 因 此 ， 软 件 
将 依次 尝试 在 导出 密 钥 生 成 算法 中 用 不 同 的 数字 摘要 算法 (包括 AES、TwoFish、Serpent 等 ) 计算 导出 密 钥 ， 然 后 用 该 导出 密 钥 依次 使 用 所 有 数据 加 密 算法 
来 解密 分 区 文件 头 的 加 密 部 分 ， 直 到 确认 解密 正确 。 


4) 如 果 解 密 后 明文 的 前 4 字 节 为 可 见 字符 串 “TRUE”， 并 且 CRC-32 校 验 码 正确 ， 则 认证 通过 ， 外 部 分 区 被 正确 加 载 。 


5) 如 果 认 证 未 通过 ， 则 用 该 密 钥 依 次 使 用 所 有 数据 加 密 算法 ， 用 LRW 模 式 来 解密 隐藏 分 区 文件 头 HiddenHeader 的 加 密 部 分 ， 直 到 确认 解密 正确 。 由 于 
隐藏 分 区 头 部 格式 也 没有 算法 标识 ， 同 样 需要 党 试用 每 种 算法 。 


6) 如 果 解 密 后 明文 的 前 4 字 节 为 可 见 字符 串 “TRUE”， 并 且 CRC-32 校 验 值 正 确 ， 则 认证 通过 ， 隐 藏 分 区 被 正确 加 载 。 


7) 如 果 两 次 认证 均 不 能 通过 ， 则 判定 口令 错误 ， 要 求 用 户 重 新 输入 口令 ， 并 重复 上 述 认 证 步骤 。 


口令 认证 过 程 的 流程 图 如 图 9-5 所 示 。 


用 户 输入 口令 






读 取 HiddenHeader 


解密 HiddenHeader 


读 取 VolumeHeader 







解 窒 VolumeHeader 


检验 明文 


解密 剩余 数据 解密 剩余 数据 


并 装载 外 部 容器 并 装载 隐藏 容 谷 


图 9-5 ”口令 认证 流程 图 


但 是 ，TrueCrypt 方 案 是 基于 桌面 Windows 系 统 的 ， 且 只 适用 于 FAT 或 NTFS， 而 不 适用 于 EXT 文 件 系统 (采用 元 数据 分 布 存 储 、 非 顺序 块 分 配 机 制 ) 。 同 
时 ， 由 于 使 用 了 一 个 特殊 的 bootloader， 可 能 会 引起 敌手 怀疑 ， 从 而 暴露 可 否认 加 密 技术 的 使 用 。 


2014 年 ， 在 国际 顶级 安全 会 议 ACM CCS (计算 机 和 通信 安全 ) 上 ，Blass 等 人 提出 了 HIVE 方 案 。 该 方案 利用 只 写 (write-only) 的 ORAM (Oblivious 
Random-Access Machine， 随 机 访问 机 器 ) ， 通过 隐 藏 用 户 对 磁盘 的 访问 模式 ， 从 而 能 够 抵抗 可 以 进行 多 次 强制 型 胁迫 的 敌手 。2015 年 ， 在 国际 顶级 安全 会 
议 NDSS (网 络 和 分 布 式 系统 讨论 会 ) 上 ，Zhao 等 人 提出 了 Gracewipe 方 案 。 他 们 考虑 到 了 这 种 情况 : 若是 强制 型 政 手 一 直 胁 迫 用 户 ， 即 使 存在 多 个 可 人 否认 的 
隐藏 分 区 也 无 法 抵抗 这 种 攻击 。 因 此 ， 在 用 户 被 胁迫 时 ， 用 户 应 该 具备 可 及 时 销毁 数据 的 能 力 。Gracewipe 利 用 可 信 平 台 模 块 (TPM) 和 CPU 中 的 可 信 执 行 模 
式 (Intel TXT) ， 通 过 输入 口令 引导 操作 系统 司 动 。Gracewipe 任 上 述 两 种 可 信 硬 件 中 维护 多 个 进入 系统 的 口令 ， 即 进入 隐藏 分 区 的 口令 PH， 进 入 可 公开 分 
区 的 口令 PN， 进 入 可 公开 分 区 同时 会 删除 隐藏 分 区 口令 (PH) 的 口令 PD。 保 障 删除 口令 的 操作 是 在 可 信和 硬件 中 完成 ， 以 保障 敌手 不 会 友 现 。PD 可 有 多 个 ， 
用 户 被 敌手 胁 担 时 ， 用 户 全 部 交代 出 PD、PN、PH, 但 是 用 户 不 区 分 各 个 口令 ， 因 此 敌手 有 1/3 的 机 会 ， 在 进入 可 公开 分 区 的 同时 销毁 隐藏 分 区 的 密 钥 ， 随 着 
PD 数 目的 增多 ， 政 手 销毁 隐藏 分 区 密 钥 的 概率 也 会 增 大 。 


9.2.3 面向 移动 系统 的 可 否认 加 密 方案 


在 我 们 的 日 党 生活 中 ， 智 能 手机 、 平 板 计 算 机 等 其 他 移动 计算 设备 已 经 非常 普及 ， 手 机 已 经 成 为 人 们 生活 、 工 作 中 一 个 必 不 可 少 的 工具 。 数 据 显 示 ，2011 
年 全 球 智能 手机 的 普及 数量 为 8 亿 7200 部 ， 换 算 为 人 口 普及 率 为 12%。 同 时 随 着 智能 手机 等 设备 系统 的 计算 功能 、 存 储 功能 的 增强 ， 人 们 也 逐渐 在 这 些 设备 中 
处 理 、 和 存储 大 量 的 个 人 、 公 司 、 政 府 等 的 隐私 信息 。 由 于 具有 体积 小 、 携 带 灵 活 的 特点 ， 移 动 设备 的 持 有 者 更 容易 遭受 强制 型 政 手 的 胁迫 ， 因 此 基于 数据 机 密 
性 的 考虑 ， 在 移动 系统 上 完善 可 否认 加 密 方案 更 加 有 必要 。 


全 盘 加 密 (Full Disk Encryption，FDE) 是 一 种 有 效 的 保证 数据 安全 方法 。 在 桌面 操作 系统 中 已 经 实现 的 全 盘 加 密 系统 包括 Windows Bitlocker、Mac 
OS FileVault 等 。 这 些 加 密 技 术 面 向 磁盘 房 区 或 者 艇 ， 可 以 全 透明 地 提供 随机 的 磁盘 加 密 访问 服务 。 但 是 这 些 方 法 都 不 具备 可 否认 性 ， 致 使 加 密 数 据 容易 遭受 


到 强制 型 敌手 的 胁迫 攻击 而 造成 泄露 。 


Android 操 作 系 统 作为 智能 手机 主要 的 系统 之 一 ， 代 码 开源 ， 从 而 得 到 了 学 术 界 的 广泛 关注 。Android 内 的 数据 可 分 为 系统 固件 及 配置 信息 、 数 据 库 和 存 
储 文件 。Android 系 统 用 户 经 昔 会 在 网 络 环境 中 传输 大 量 敏感 信息 ， 为 确保 友 送 消息 的 真实 性 (不 可 伪造 ) 、 不 可 否认 性 、 数 据 完整 性 等 问题 ， 我 们 必须 保证 
在 通信 过 程 中 的 两 个 最 基本 的 安全 需求 ， 也 融 是 加 密 和 认证 。 因 此 ， 需 要 根据 不 同 层次 、 依 据 不 同 数据 类 型 、 针 对 具体 情况 提出 相 适 应 的 安全 解决 方案 ， 从 而 
对 基于 Android 系 统 的 数据 形成 有 效 的 安全 保护 。 接 下 来 ， 本 小 节 将 会 介绍 学 术 界 近 几 年 来 最 新 的 面向 移动 系统 (Android) 的 可 否认 加 密 方案 。 


1.Mobiflage (NDSS2013) 


2013 年 ，sSkillen 等 人 提出 了 第 一 个 在 移动 操作 系统 Android 上 的 可 否认 加 密 方案 Mobiflage。 该 方案 基于 隐藏 加 密 卷 的 思想 ， 在 Android 手 机 的 外 置 SD 卡 
上 实现 ， 仪 支持 FAT32 文 件 系统 。 


Mobiflage 方 案 的 敌手 模型 与 假设 如 下 : 
1) 将 本 方案 代码 合并 a 到 Android 固 件 代 码 中 ， 保 证 设备 可 以 使 用 本 方案 。 


2) 本 方案 需要 一 个 外 置 的 SD 卡 ， 并 将 其 格式 化 为 FAT32 文 件 系统 。 所 以 ， 部 分 手机 如 Nexus S (使 用 内 置 e:MMC 卡 ) ， 以 及 Galary Nexus (无 外 部 存 
储 ) 不 支持 本 方案 。 


3) 假设 敌手 是 理智 的 ， 即 敌手 在 获得 一 个 密 钥 后 ， 即 可 公开 分 区 的 诱 乌 密 钥 后 会 停止 询问 、 胁 迫 用 户 。 
4) 政 手 知道 本 方案 的 设计 ， 但 是 敌手 不 知道 隐藏 分 区 的 密 钥 ， 也 不 知道 隐藏 分 区 相对 于 可 公开 分 区 的 偏 移 量 。 


5) 面向 果 面 系统 的 可 人 否认 加 密 方案 一 般 会 假设 敌手 具有 可 周期 性 多 次 访问 、 胁 迫 用 户 的 能 力 。 但 在 移动 存储 设备 上 ， 一 般 只 假设 一 次 访问 型 政 手 ， 如 用 
户 被 挟持 后 。 因 此 ， 本 文 只 针对 一 次 访问 型 敌手 。 


6) 假设 操作 系统 、 内 核 、APP、bootloader 等 安全 ， 并 假设 用 户 只 使 用 可 信 的 APP， 设 备 固 件 安全 。 
7) 政 手 不 可 在 设备 处 于 隐藏 区 分 模式 时 挟持 用 户 。 


8) 敌手 只 可 能 在 设备 处 于 可 公开 分 区 时 扶持 用 户 ， 从 而 可 以 得 到 并 访问 手机 的 内 部 、 外 部 存储 设备 ， 包 括 设备 的 RAM 内 存 镜像 ， 因 此 本 文 无 法 有 效 解决 
冷 启动 (cold-boot) 攻击 。 


9) 加 密 结 果 与 随机 数 不 可 区 分 ， 本 文 使 用 XTS-AES 算 法 对 数据 进行 加 解密 。 

Mobiflage 方 案 的 具体 实现 过 程 如 下 : 

1) 先 将 整个 外 部 存储 设备 ， 即 SD 卡 写 满 随机 数 ， 来 掩 蘑 隐 藏 分 区 的 存在 。 

2) 建立 两 个 相 邻 的 分 区 。 第 一 个 是 用 尸 数 据 分 区 ， 用 于 保存 应 用 、 设 置 等 。 第 二 个 是 较 大 的 附属 分 区 ， 用 来 保存 文件 、 图 片 等 。 

3) 在 外 部 仓储 设备 ， 即 SD 卡 上 建立 隐藏 分 区 ， 隐 藏 分 区 的 起 始 地 址 源 于 用 户 隐藏 分 区 的 口令 ， 这 使 得 系统 不 用 存储 隐藏 分 区 的 起 始 地 址 。 
Mobiflage 方 案 的 系统 启动 过 程 如 下 : 


1) 手机 启动 时 ， 先 挂 载 用 户 数 据 分 区 ， 若 找到 一 个 有 效 的 文件 系统 ， 则 显示 启动 前 认证 口令 输入 窗口 ， 用 户 可 输入 相应 口令 以 进入 不 同 的 系统 工作 模 


2) 系统 检测 到 用 户 输入 口令 ， 利 用 PBKDF2 散 列 函 数 计 算出 用 于 解密 加 密 卷 的 密 钥 。 

3) 利用 上 述 得 到 的 密 钥 ， 解 密 可 公开 分 区 的 数据 。 

4) 若 解 密 成 功 ， 系 统 进入 公开 分 区 模式 。 

5) 各 解密 失败 ， 系 统 不 立即 提醒 用 户 输入 新 的 口令 ， 而 是 通过 用 户 输入 的 口令 计算 一 个 逻辑 地 址 偏 移 量 。 


6) 系统 从 上 述 偏 移 量 开始 的 逻辑 地 址 进行 解密 ， 若 系统 成 功 解密 并 找到 一 个 有 效 的 文件 系统 ， 则 从 隐藏 分 区 局 动 ， 若 系统 解密 失败 ， 则 提示 用 户 输 入 新 
的 口令 。 


Mobiflage 方 案 是 第 一 个 在 移动 操作 系统 Android 上 实现 的 可 否认 加 密 方案 ,但 是 它 存在 如 下 缺点 与 不 足 : 


1) Mobiflage 基 于 隐藏 卷 的 思想 ， 将 一 个 固定 的 逻辑 块 地 址 作为 隐藏 分 区 的 起 始 地 址 ， 使 得 本 方案 只 适用 于 逻辑 地 址 顺序 分 配 的 文件 系统 ， 如 FAT32， 
而 不 适用 于 逻辑 地 址 空间 非 连续 分 配 型 的 文件 系统 ， 如 EXT4。 


2) 各 分 区 可 能 会 产生 禾 戎 问题 ， 因 此 在 使 用 各 分 区 时 ， 用 户 需要 知道 本 分 区 的 剩余 容量 ， 防 止 覆 兰 其 他 分 区 数据 。 
3) 切换 到 隐藏 分 区 时 需要 重启 设备 。 


4) 现在 更 多 的 主流 手机 往往 没有 外 置 SD 卡 ， 而 是 使 用 内 置 eMMC 卡 。 而 且 Android 操 作 系 统 默 认 的 文件 系统 类 型 是 EXT4， 而 不 是 FAT32， 这 使 得 该 方案 
应 用 范围 变 小 。 


2.Mobiflage (TDSC2014) 
为 了 解决 上 述 Mobiflage 方 案 中 对 外 置 SD 卡 以 及 FAT32 文 件 系统 的 限制 ，2014 年 Skillen 等 人 提出 了 改进 方案 ， 也 称 之 为 Mobiflage 方 案 。 


改进 的 Mobiflage 方 案 在 原 方案 的 基础 上 ， 通 过 修改 EXT4 文 件 系 统 的 驱动 ， 在 手机 内 部 存储 EXT4 文 件 系统 上 实现 了 可 否认 加 密 方案 。 改 进 的 Mobiflage 
方案 的 假设 与 Mobiflage 方 案 的 假设 基本 一 致 。 


EXT4 文 件 系 统 作 为 Android 操 作 系统 内 部 仓储 的 默认 文件 系统 ， 具 有 元 数据 分 散 、 目 录 分 散 、 非 顺序 块 分 配 、 文 件 头 与 文件 数据 分 开 和 存储 的 特点 。 为 了 在 
实现 可 否认 加 密 的 同时 ， 避 免 产 生 数 据 覆盖 ， 改 进 的 Mobiflage 方 案 主 要 对 EXT4 文 件 系统 的 节点 分 配 机 制 做 了 修改 : 改进 的 Mobiflage 使 用 顺序 节点 分 配 ， 即 
在 创建 文件 时 ， 总 是 选择 第 一 个 有 空闲 证 点 (free inode) 的 空间 块 (free block) 的 块 组 (block group) 。 这 样 融 通过 强制 将 EXT4 文 件 系统 改 为 线性 使 用 
逻辑 地 址 空间 ， 减 小 了 数据 覆盖 的 可 能 性 。 但 是 值得 注意 的 是 ， 改 进 的 Mobiflage 修 改 了 EXT4 文 件 系 统 的 驱动 ， 这 本 身 开会 引起 政 手 的 怀疑 。 


3.MobiHydra 


2014 年 ，Yu 等 人 提出 了 MobiHydra 方 案 ， 这 个 方案 是 对 Mobiflage 方 案 的 改进 ， 同 样 需要 一 个 外 置 的 物理 (或 模拟 ) 的 、 格 式 化 为 FAT32 文 件 系 统 的 SD 
卡 。MobiHydra 方 案 的 假设 与 Mobiflage 方 案 的 假设 基本 一 致 。 


MobiHydra 方 案 的 主要 贡献 是 发 现 了 Mobiflage 方 案 易 遭受 的 一 个 攻击 ， 称 为 启动 攻击 (booting-time attack) : 当 移 动 设备 只 具备 全 盘 加 密 功能 ， 
没有 可 否认 加 密 功能 时 ， 系 统 局 动 时 用 户 输 入 一 个 口令 ， 阁 正确 则 系统 正常 启动， 否则 系统 会 立即 提示 用 户 重 新 输入 口令 。 用 尸 输入 口令 的 正确 与 否 对 系统 反 
应 时 间 的 影响 不 大 。 但 是 ， 由 于 使 用 Mobiflage 方 案 的 移动 设备 存在 可 否认 加 密 模式 ， 用 户 输 入 口令 后 ， 若 是 公开 分 区 口令 ， 则 系统 直接 启动 。 但 是 若 用 户 输 
入 的 口令 不 是 公开 分 区 口令 ， 系 统 不 会 立即 提示 错误 ， 要 求 用 户 重新 输入 ， 而 是 继续 验证 输入 口令 是 否 为 隐藏 分 区 口令 ， 因 而 系统 认证 所 需 时 间 较 长 ， 从 而 使 
收 手 发 现存 人 在 可 否认 加 密 模式 。 


为 了 抵抗 上 述 攻击 ，MobiHydra 方 案 提出 了 改进 方法 ， 其 具体 实现 过 程 如 下 : 
1) 先 将 整个 外 部 存储 设备 ， 即 SD 卡 写 满 随机 数 ， 来 掩盖 隐藏 分 区 的 存在 。 
2) 用 户 确定 隐藏 分 区 的 个 数 。 


3) 在 外 部 和 存储 设备 上 建立 一 个 特殊 的 分 区 shelter volume， 暂 存 需要 从 公开 分 区 转移 到 隐藏 分 区 的 数据 。 暂 存在 shelter volume 分 区 下 的 数据 在 公开 分 
区 中 不 可 解密 。 当 设备 下 次 从 隐藏 分 区 局 动 时 ， 系 统 自 动 将 shelter volume 分 区 下 的 数据 转 存 到 隐藏 分 区 中 ， 然 后 将 shelter volume 清 空 ， 因 而 可 以 实现 不 需 
要 重启 设备 ， 就 可 以 实现 从 公开 分 区 模式 向 隐藏 分 区 模式 转 存 数据 。 


4) shelter volume 位 于 外 部 存储 的 后 端 边 缘 ， 在 公开 分 区 模式 下 作为 一 个 块 设 备 挂 载 ， 因 而 导致 外 部 存储 空间 小 于 其 实际 物理 空间 ， 可 能 会 引起 敌手 怀 
疑 ， 但 可 以 解释 为 系统 影响 ， 因 此 shelter volume 空 间 需 设置 得 较 小 。 


5) 公开 分 区 或 任意 一 个 隐藏 分 区 局 动 时 ， 会 显示 除了 shelter volume 的 所 有 存储 空间 。 
6) 高 级 别 隐 藏 分 区 启动 时 ， 会 同时 显示 低级 别 隐 藏 分 区 的 数据 。 


7) MobiHydra 通 过 在 用 尸 输入 正确 的 口令 时 ， 多 执行 3N (NN 为 支持 的 可 否认 级 别 数 ， 即 隐藏 分 区 的 个 数 ) 次 PBKDF2 散 列 操作 ， 来 将 用 户口 令 转化 成 解 
密 分 区 的 密 钥 ， 减 小 系统 对 正确 与 错误 口令 反应 时 间 之 间 的 差别 ， 从 而 抵抗 局 动 攻击 。 


MobiHydra 在 Mobiflage 方 案 的 基础 上 ， 通 过 增加 隐藏 分 区 的 个 数 ， 提 出 了 多 层 可 否认 加 密 的 概念 ， 通 过 增加 系统 由 口令 生成 密 钥 的 操作 时 间 来 抵抗 局 动 
攻击 。 但 是 ，MobiHydra 方 案 仍 然 存 在 Mobiflage 方 案 的 局 限 ， 比 如 只 支持 具备 外 部 SD 卡 的 存储 设备 ， 且 只 支持 FAT32 文 件 系 统 ， 各 分 区 之 间 仍 存在 数据 覆 


盖 的 问题 等 。 
4.MobiPluto 


2015 年 ，Chang 等 人 提出 了 MeobipPluto 方 案 。MobipPluto 方 案 的 假设 与 Mobiflage 方 案 的 假设 基本 一 致 。Mobiflage 和 MobiHydra 方 案 为 了 防止 公开 分 
区 与 隐藏 分 区 发 生 数 据 履 盖 问 题 ， 而 限制 其 使 用 范围 仅 为 具备 外 部 SD 卡 的 存储 设备 ， 或 者 修改 EXT4 文 件 系统 的 驱动 。 但 是 ， 从 根本 上 来 说 ， 造 成 数据 履 盖 问 
题 的 原因 是 上 层 文件 系统 对 逻辑 地 址 空间 (LBA) 的 非 顺 序 使 用 。 


为 了 避免 由 于 存储 空间 分 配 不 足 可 能 导致 的 错误 ， 人 存储 系统 往往 会 为 文件 提前 分 配 好 比 实际 需要 的 更 多 空间 (thick provisioning) ， 这 样 残 导 致 了 存储 


空间 的 浪费 。Android 操 作 系 统 中 的 上 自动 精简 配置 (thin provisioning) 技术 可 以 保证 只 为 应 用 分 配 虚 拟 逻 辑 地 址 ， 只 有 当真 正 需要 将 数据 仓储 到 物理 介质 上 
时 才 真正 分 配 逻 辑 地 址 。 因 此 可 以 利用 thin provisioning 机 制 ， 将 系统 的 非 顺序 逻辑 地 址 分 配 转化 为 存储 设备 上 逻辑 地 址 的 顺序 分 配 。 


MobiPluto 方 案 利 用 Android 操 作 系 统 中 的 目 动 精简 配置 技术 ， 基 于 隐藏 卷 的 基本 原理 实现 可 否认 加 密 ， 使 得 设备 无 论 格式 化 为 任何 块 文件 系统 (如 
FAT32、EXT2、EXT4、NTFS 等 ) ， 都 保证 系统 对 逻辑 地 址 空间 的 使 用 是 顺序 的 ， 以 此 屏 贡 了 文件 系统 的 差异 ， 使 得 MobiPluto 方 案 适 用 于 任何 块 文件 系统 ， 
即 达 到 文件 系统 友好 。 


下 面 结合 图 9-6 与 图 9-7 用 一 个 具体 的 例子 对 MobiPluto 方 案 的 效果 进行 详细 的 解释 。 


加 密 的 隐藏 分 区 密 铀 
物理 卷 标签 物理 卷 标签 
VG 元 数据 VG 元 数据 
元 数据 卷 隐藏 分 区 偏 移 量 元 数据 卷 密 钥 信息 


数据 郑 








数据 卷 
PE WN EE EE A 


人 
隐藏 分 区 《用 隐藏 密 钥 加 密 ) 


公开 分 区 《用 诱饵 密 钥 加 密 ) 






图 9-6 ”MobiPluto 方 案 磁盘 分 配 效果 图 
1) 假设 系统 的 整个 可 用 逻辑 地 址 空间 (LBA) 为 0~150。 以 逻辑 地 址 100 为 起 始 地 址 ， 建 立 隐藏 分 区 。 
2) 在 公开 分 区 模式 下 显示 的 可 用 逻辑 地 址 空间 为 0~ 150， 即 显示 总 可 用 容量 为 151 个 LBA 逻 辑 地 址 。 


3) 在 隐藏 分 区 模式 下 显示 的 可 用 逻辑 地 址 空间 为 100~ 150。 隐 藏 分 区 作为 一 个 独立 分 区 使 用 其 可 用 逻辑 地 址 空间 相当 于 0~ 50， 显 示 忌 可 用 容量 为 51 个 
LBA 多 辑 地 址 。 


4) 为 了 防止 友 生 数据 履 羡 现象， 在 公开 分 区 模式 下 ， 合 法 用 户 其 实 只 可 以 用 0~99 (100 个 逻辑 地 址 ) 。 若 使 用 了 100~150 之 间 的 逻辑 地 址 ， 残 会 覆盖 隐 
藏 分 区 模式 下 的 数据 ， 造 成 隐藏 分 区 数据 丢失 ， 设 置 无 法 再 次 从 隐藏 分 区 局 动 系统 。 


5) 在 FAT32 这 种 顺序 使 用 逻辑 地 址 空间 的 文件 系统 下 ， 类 似 于 Mobiflage 和 MeobiHydra 方 案 ， 只 要 保证 在 公开 分 区 模式 下 不 使 用 超过 100 (0~99) 个 逻 
辑 地 址 丈 可 以 防止 友 生 数据 覆盖 现象 。 


6) 但 在 EXT4 这 种 非 顺 序 使 用 逻辑 地 址 空间 的 文件 系统 情况 下 ， 就 很 容易 造成 数据 覆盖 现象 ， 因 此 改进 的 Mobiflage 方 案 修改 了 EXT4 文 件 系统 的 驱动 ， 将 
EXT4 的 逻辑 地 址 空间 使 用 逻辑 强制 改 成 了 顺序 使 用 方式 。 


7) MobiPluto 方 案 束 是 通过 thin provisioning 机 制 ， 如 图 9-7 所 示 ， 将 上 层 文件 系统 使 用 逻辑 地 址 空间 的 逻辑 顺序 ， 统 一 改 成 顺序 使 用 ， 屏 珊 各 种 文件 系 
统 之 间 的 差异 。 


8) 将 公开 分 区 格式 化 为 顺序 或 者 非 顺 序 使 用 逻辑 地 址 空间 的 文件 系统 ， 在 公开 分 区 模式 下 ， 系 统 可 按 任意 顺序 使 用 地 址 空间 0~ 1250， 只 要 保证 使 用 的 远 
辑 地 址 总 量 不 超过 100 束 可 以 防止 对 隐藏 分 区 的 数据 造成 覆盖 。 


9) 类 似 的 ， 也 可 将 隐藏 分 区 格式 化 为 顺序 或 者 非 顺序 使 用 远 辑 地 址 空间 的 文件 系统 ， 在 隐藏 分 区 模式 下 ， 系 统 可 按 任 意 顺 序 使 用 地 址 空间 0~ ?0， 只 要 保 
证 使 用 的 逻辑 地 址 总 量 不 超过 ?51 融 可 以 防止 对 公开 分 区 的 数据 造成 覆 兰 。 
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图 9-7 ”MobiPluto 方 案 thin provisioning 机 制 效果 图 
5. 共 同 点 
通过 以 上 对 面向 移动 系统 Android 的 可 否认 加 密 方 案 一 一 Mobiflage、MobiHydra 以 及 MobiPluto 的 详细 分 析 ， 我 们 可 以 总 结 出 这 些 方案 有 如 下 共同 点 : 
1) 都 是 基于 隐藏 卷 (Hidden Volume) 的 基本 原理 实现 可 否认 加 密 。 隐 藏 分 区 的 起 始 地 址 是 通过 用 户口 令 生 成 的 一 个 固定 值 。 
2) 用 户 无 法 自 定 义 隐藏 分 区 的 大 小 。 因 为 一 旦 用 户口 令 确定 ， 隐 藏 分 区 相对 于 公开 分 区 的 偏 移 量 就 固定 了 。 


3) 均 存 在 友 生 公开 分 区 与 隐藏 分 区 之 间 数 据 覆 茉 现 象 的 可 能 性 。 
9.2.4 ”面向 NAND Flash 的 可 否认 加 密 方 案 


智能 手机 中 的 内 置 存 储 器 eMMC 卡 和 外 置 存 储 器 SD 卡 ， 以 及 平板 计算 机 、 新 型 笔记 本 计算 机 中 的 固态 硬盘 (SSD) ， 都 是 以 NAND Flash 作 为 底层 物理 存 
储 介 质 ， 外 加 硬件 控制 器 (运行 FTL) 而 封 妆 成 的 存储 器 件 。 


上 述 所 有 面向 桌面 系统 、 移 动 系统 的 可 否认 加 密 方案 ， 均 将 基于 NAND Flash 的 存储 器 件 当 作 一 个 普通 的 块 存储 设备 ， 而 没有 考虑 NAND Flash 特 殊 的 物 
理性 质 对 可 否认 加 密 方案 的 影响 。 比 如 NAND Flash 末 取 的 是 非 原 位 更 新 的 数据 更 新 策略 ， 因 此 基于 原 位 更 新 集 略 的 可 否认 加 密 方案 束 不 适用 了 ; NAND 
Flash 中 的 块 都 具有 一 定 的 擦 写 寿命 ， 需 要 执行 使 用 均衡 策略 来 保证 基于 NAND Flash 的 存储 器 件 的 使 用 寿命 ， 因 此 在 设计 可 否认 加 密 方案 时 需要 进行 特殊 的 处 
理 。 


2015 年 ，Peters 等 人 提出 了 一 个 新 的 方案 DEFY (A Deniable，Encrypted File System for Log-Structured Storage) ， 其 是 第 一 个 面向 NAND Flash 存 
储 器 设计 的 可 否认 加 密 方案 。DEFY 方 案 基 于 YAFFS2， 一 个 专门 为 NAND Flash 设 计 的 误 入 式 日 志 结 构 的 文件 系统 ， 其 直接 对 “ 裸 ”NAND Flash 进 行 操作 ， 
而 不 需要 再 执行 FTL。 关 于 YAFFS2 的 具体 介绍 可 以 参看 本 书 前 面 内 容 ， 为 了 更 好 地 理解 DEFY 方 案 中 的 具体 策略 ， 下 面 总 结 一 下 YAFFS2 的 特点 : 


1) YAFFS2 是 一 个 真正 的 日 志 式 结构 的 文件 系统 ， 因 为 考虑 到 NAND Flash 需 要 使 用 均衡 策略 ， 因 此 其 写 请 求 按照 逻辑 地 址 空间 顺序 分 配 。 
2) YAFFS2 使 用 NAND Flash 每 一 页 的 OOB 区 存储 系统 元 数据 以 及 纠 错 码 等 。 


3) YAFFS2 中 的 每 一 个 实体 ， 包 括 文件 、 目 录 、 链 接 等 ， 都 作为 一 个 对 象 存储 ， 每 一 个 对 象 都 有 一 个 对 应 的 对 象 头 。 对 象 头 中 包含 对 象 名 、 对 象 大 小 及 对 
象 所 对 应 的 页 号 。 一 个 目录 的 对 象 头 中 包含 其 孩子 目录 (文件 、 子 目录 等 ) 的 对 象 头 的 位 置 。 


4) YAFFS2 写 操作 的 单位 是 1 页 (在 YAFFS 中 称 为 chunk) ， 与 NAND Flash 的 写 操作 的 基本 单位 一 致 。1 页 的 大 小 范围 是 512B ~ 32KB。YAFFS2 总 是 将 写 
操作 请 求 的 目标 数据 按 页 划分 ， 写 入 当前 使 用 页 ， 当 一 个 块 写 满 后 ， 再 找 下 一 个 空闲 页 的 块 写 入 数据 。 每 一 个 使 用 页 都 分 配 一 个 序号 并 存 于 OOB 区 ， 这 个 序号 
单调 递增 ， 以 方便 系统 寻找 当前 使 用 页 。 


5) YAFFs2 中 的 一 个 页 被 更 新 时 ， 其 对 应 的 对 象 头 也 会 更 新 并 被 写 入 新 的 一 页 中 ， 并 且 包 含 此 对 象 头 的 对 象 比如 目录 ) 也 会 被 更 新 ,一 直 更 新 到 根 目 
录 。 


6) YAFFS2 擦 除 操作 的 单位 是 1 块 ， 与 NAND Flash 的 擦 除 操作 的 基本 单位 一 致 。1 块 的 大 小 汽 围 是 32 ~ 128 页 。 


7) YAFFS2 维 护 一 个 特殊 的 对 象 称 为 checkpoint， 其 中 记录 当前 文件 系统 的 状态 信息 。 当 挂 载 YAFFS2 时 ， 系 统 寻 找 最 新 的 checkpoint， 用 来 重建 系统 的 
内 存 数据 结构 。 若 没有 找到 checkpoint，YAFFS2 会 扫描 每 一 个 NAND Flash 块 ， 并 按照 每 一 个 页 的 序号 进行 排序 ， 在 内 存 中 建立 当前 系统 有 效 页 的 数据 结 
构 。 因 此 ，YAFFS2 无 须 像 其 他 文件 系统 (FAT32、EXT2/3/4，NTFS) 一 样 需要 人 在 挂 载 前 进行 格式 化 操作 。 


8) YAFFS2 的 使 用 均衡 策略 采用 动态 使 用 均衡 ， 即 数据 总 是 写 入 使 用 次 数 最 少 的 空间 块 中 ， 这 种 策略 相对 于 静态 使 用 均衡 更 加 入 单 。 而 静态 使 用 均衡 使 当 
前 一 些 正在 使 用 的 块 也 可 能 被 回收 来 承担 新 的 写 请 求 ， 逻 辑 相 对 复杂 。 


9) YAFFS2 支 持 两 种 垃圾 回收 集 略 : 系统 局 动 时 ， 采 用 消极 垃圾 回收 ， 即 扫 摘 块 ， 当 至 多 4 页 为 有 效 页 时 ， 则 此 块 作为 目标 块 进行 回收 。 各 未 找到 符合 要 
求 的 块 ， 则 将 国 值 递 增 (如 2?，6，7，.…) ， 但 是 立 值 不 会 超过 一 块 中 页 数 的 一 半 。 当 所 有 的 块 都 用 过 超过 一 半 时 ， 转 为 采用 积极 垃圾 回收 ， 即 只 要 一 块 中 合 
有 无 效 页 ， 则 当 作 是 目标 块 进行 回收 。 


下 面 介 绍 一 下 DEFY 方 案 的 敌手 模型 与 假设 : 


1) DEFY 方 案 定义 了 两 种 类 型 的 强制 型 敌手 。 第 一 种 是 只 能 对 存储 设备 进行 一 次 访问 的 敌手 ， 如 设备 被 偷 、 没 收 、 扣 留 等 情况 。 第 二 种 是 可 以 多 次 周期 性 
访问 存储 设备 的 敌手 ， 如 携 市 机 密 设备 多 次 穿越 边境 线 ， 这 样 的 敌手 可 以 比较 数据 的 变化 ， 从 而 可 能 友 现 隐藏 分 区 或 文件 的 人 存在。 


2) 政 手 对 存储 设备 的 一 次 “访问 ”可 以 获得 : 存储 设备 的 逻辑 快照 和 对 文件 系统 的 摘 述 ， 即 文件 系统 的 组 织 结构 。 
3) 政 手 不 拥有 存储 设备 的 时 候 ， 不 可 以 获得 设备 RAM 的 内 容 以 及 设备 的 运行 状态 。 


4) 敌手 拥有 设备 的 时 候 ， 可 以 获得 设备 RAM 的 内 容 以 及 设备 的 运行 状态 ， 因 此 DEFY 同 其 他 方案 一 样 ， 假 设 除 可 公开 模式 下 ， 用 户 不 可 以 被 政 手 获 得 存 
储 设 备 ， 也 不 可 以 抵抗 冷 局 动 攻击 。 


接 下 来 开始 介绍 DEFY 方 案 的 主要 特点 。DEFY 在 YAFFS2 上 做 了 大 量 的 修改 ， 加 入 了 认证 加 密 、 安 全 删除 、 支 持 多 个 可 否认 级 别 等 特点 ， 其 主要 的 设计 特 
点 如 下 。 


1. 支 持 多 个 可 否认 级 别 


DEFY 方 案 支 持 多 个 可 否认 级 别 ， 每 一 个 级 别 对 应 一 个 目录 (一 个 目录 可 以 理解 为 其 他 可 否认 加 密 方案 中 的 一 个 分 区 ) ， 并且 可 以 动态 创建 可 否认 级 别 。 
每 一 个 可 否认 级 别 都 是 文件 系统 根 目 录 下 的 一 个 子 目 录 ， 访 级别 下 的 文件 都 在 此 目录 下 保存 。 每 一 个 可 否认 级 别 分 配 一 个 唯一 的 名 字 ， 以 及 一 个 从 用 户口 令 产 
生 的 密 钥 。 


DEFY 方 案 不 记录 当前 系统 存在 的 目录 个 数 ， 系 统 只 知道 当前 所 打开 的 可 否认 级 别 。 为 了 减少 数据 被 覆盖 的 可 能 性 ， 当 用 户 打开 一 个 级 别 时 ， 比 该 级 别 低 
的 所 有 级 别 也 被 呈现 ， 保 证 DEFY 不 会 对 下 级 目录 造成 覆盖 。 


2. 文 持 认证 加 密 


在 YAFFS2 中 添加 认证 加 密 功能 以 保障 数据 的 机 密 性 和 完整 性 ， 但 难点 是 认证 加 密 后 密 文 会 比 明文 长 ， 因 此 需要 解决 由 认证 加 密 带 来 的 数据 扩张 问题 。 
DEFY 的 认证 加 密 方案 如 图 9-8 所 示 ， 下 面 着 重 介绍 一 下 其 加 密 算法 : 


Input: Encrypted Page (zl,...,zm) with page ID id, 
OOB data zo0b, counter zx, tag +, per-level keys Jte, Me 
: Ctr2 4— PAD-128(id||x||0) 

:GT 上 中 出... 册 Im 由 ob 

Cl Cr Coob 和 一 AES-CTR'" (xz, ss En Toob) 


Input: Data Page (di dm) with page ID id, OOB 
data doob. COUuNter x, and per-level keys Ke. Me 
l: ctri + PAD-128(id||z||1) 
2 Cs. Cm Cosb = AES-CTRK (di 
:ot HMAC-SHA256M, (cl ..., Cm, Coos) 
: ctra + PAD-128(id||x||0) 
: Tm, Toob 全 AES-CTRs ™(c1,..., cm, coo) :ctrl 全 PAD-128(idl|z|l1) 


‘to BIl... BIm BIoob ctrl 
utput Tag 上 Page (x1,...,Tm) and OOB ro De og + AES-CIRE, (C1,..., Cm Coob) 


:0 + HMAC-SHA256m,(c1,..., Cm, Coob) 
if oo retum 上 


me 





a) AON 加 密 b) AON 解密 
图 9-8 DEFY 的 认证 加 密 方案 


1) 算法 输入 : 一 个 页 的 数据 ， 并 将 此 页 的 数据 拆 分 为 m 段 (d1，d2，.…，dm) ， 每 段 128 位 ， 以 及 页 id、 页 OOB 区 数据 、 计 数 器 x、 所 在 级 别 加 密 用 的 密 
钥 KI、 所 在 级 别 认证 所 用 的 密 钥 Ml。 其 中 K 和 M 是 根据 用 户口 令 和 该 级 别 的 名 称 ， 通 过 PBKDF 生 成 的 。 加 密 过 程 中 不 会 重复 使 用 同一 个 计数 器 及 密 钥 对 。 


2) 填充 (id||x||1) 至 128 位 ， 得 ctr1。 
3) 使 用 AES-CTR 计 数 模式 ， 加 密 该 页 的 数据 以 及 OOB 区 的 数据 ， 得 密 文 (c1，c2?，.…，cm，coob) 。 
4) 将 密 文 (c1，c2，...，Cm，Coob) 进行 HMAC-SHA256 散 列 ， 得 散 列 认证 值 。 


5) 填充 (idj|x||0) 至 128 位 ，， 得 ctr2。 


6) 再 次 使 用 AES-CTR 计 数 模式 ， 用 散 列 值 作为 密 铜 ， 再 次 加 密 密 文 (C1，C2，...，Cm，Coob) ， 得 (X1, X2, .…， Xm, Xoob) 。 

7) 散 列 值 与 (xX1，x2，…，xm，xoob) 异 或 ， 得 t (128 位 ，t 不 是 秘密 ， 是 认证 加 密 后 ， 密 文 比 明 文 所 扩张 的 数据 ) 。 

8) 输出 : t， (XxX1, X2, ..., Xm) ， Xoob。 

9) 将 t 作 为 元 数据 ， 存 到 该 页 所 在 的 父 对 和 象 中 ， (xX1，X2，.…，Xm) 和 存 到 该 页 的 数据 区 ，xoob 存 到 该 页 的 OOB 区 。 

3. 支 持 安全 删除 

以 上 AON (all or nothing) 机 制 在 提供 认证 加 密 的 同时 ， 也 可 以 提供 安全 删除 功能 。 安 全 删除 功能 是 可 否认 加 密 的 补充 。 

1) DEFY 方 案 采 用 基于 加 密 的 安全 删除 ， 采 用 AON 加 密 机 制 ， 使 得 一 页 中 的 密 文 数据 必须 完全 解密 才 可 以 获得 明文 ， 任 意 部 分 密 文 不 可 以 单独 解密 。 
2) 删除 存在 父 对 象 中 的 t， 束 可 以 保证 对 应 页 的 数据 无 法 解密 ， 实 现 安全 删除 对 应 页 的 数据 。 

3) DEFY 方 案 修 改 了 YAFFS2 对 象 头 存 元 数据 的 方式 ， 数 据 页 的 t 存 在 文件 对 象 (file object) 中 ， 而 文件 对 象 的 t 存 在 目录 对 象 (directory object) 中 。 


4) 当 子 对 象 修改 ， 其 父 对 象 的 对 象 头 就 需 更 新 t， 重 写 原 t， 安 全 删除 日 对 象 ， 因 此 修改 一 个 对 象 { (可 能 是 数据 、 文 件 、 目 录 ) ， 就 导致 其 到 文件 系统 根 
目录 的 所 有 对 象 都 需 更 新 ， 导 致 [级 联 删除 。 


5) DEFY 方 案 将 各 级 别 的 t 都 存在 TSA (Tag Storage Area) 中 单独 管理 ， 与 文件 系统 其 他 部 分 分 开 管理 。 
6) 更 新 一 个 级 别 的 t 时 ， 将 该 级 别 t 重 写 到 一 个 新 块 中 ， 然 后 删除 原 块 ， 再 写 入 随机 数 。 

7) TSA 单 独 管 理 ， 各 级 别 分 块 管理 ， 使 得 可 以 快速 删除 一 个 级 别 或 整个 文件 系统 。 

4. 防 止 数据 覆盖 


DEFY 不 记录 系统 中 使 用 页 和 空闲 页 (used/free) 的 情况 ， 只 要 是 在 当前 已 显示 各 个 级 别 下 不 可 解密 的 页 ， 都 认为 是 可 用 的 空 (free) 页 ， 因 此 丈 不 可 
避免 地 会 对 未 显示 级 别 的 数据 造成 履 蒜 ， 造 成 数据 丢失 。DEFY 及 取 以 下 策略 来 组 减 数 据 被 覆盖 的 可 能 性 : 


1) 挂 载 一 个 级 别 时 ， 当 前 显示 级 别 等 级 以 下 的 所 有 级 别 同 时 显示 ， 保 证 不 会 对 下 级 目录 数据 造成 覆盖 。 
2) 每 一 个 级 别 单独 使 用 1 个 块 ， 即 不 同 的 级 别 不 共享 数据 块 。 这 样 同时 简化 了 块 回收 策略 。 


3) 当 同 时 挂 载 多 个 级 别 时 ， 各 个 级 别 的 checkpoint 写 入 不 同 的 块 ， 且 从 最 高 级 别 到 最 低级 别 依次 写 入 。 这 么 做 还 有 一 个 好 处 : 可 在 不 同 的 系统 快照 之 间 
提供 可 否认 性 ， 伪 妆 成 系统 只 是 在 最 低级 别 上 进行 挂 载 与 熏 载 操作 。 


接 下 来 ， 具 体 介绍 DEFY 方 案 的 一 些 重要 的 文件 系统 操作 过 程 。 
(1) checkpoint 


DEFY 中 的 每 一 个 级 别 都 维护 着 一 个 checkpoint。 每 次 凶 载 DEFY 方 案 时 或 在 文件 系统 操作 过 程 中 ，DEFY 都 会 写 入 新 的 checkpoint， 其 中 记录 着 当前 显示 
级 别 的 当前 使 用 页 及 最 新 的 系统 状态 标记 。 这 么 做 是 为 了 在 系统 骨 演 之 后 可 以 恢复 到 一 个 稳定 的 状态 。 


(2) 分 配 可 用 块 、 页 的 策略 


DEFY 在 任何 一 个 级 别 的 文件 系统 挂 载 起 来 后 ， 都 会 在 内 存 中 创建 一 个 空 闪 页 位 图 表 (free-page bitmap) 来 进行 页 分 配 。DEFY 只 维护 一 个 空间 页 位 图 
表 ， 任 何在 当前 已 显示 的 级 别 下 不 可 解密 的 页 都 认为 是 空 页 ， 即 可 以 进行 分 配 。 分 配 页 时 ， 每 个 块 中 的 页 都 属于 同一 级 别 ， 因 此 当 文 件 系 统 凶 载 时 ， 若 一 个 
块 中 的 页 未 完全 用 完 ， 需 将 本 块 中 未 用 页 写 满 俯 随机 数 。 


无 论 在 哪个 级 别 ，DEFY 都 采取 顺序 分 配 块 和 页 的 策略 ， 而 不 是 使 用 随机 块 分 配 的 策略 。 
(3) DEFY 文 件 系统 挂 载 、 创 建 、 御 载 级 别 的 策略 


DEFY 不 记录 系统 中 一 共存 在 多 少 个 可 否认 级 别 ， 因 此 当局 动 一 个 级 别 时 ， 会 试图 解密 所 有 块 ， 来 寻找 该 级 别 对 应 的 checkpoint。 一 旦 找到 该 级 别 有 效 的 
checkpoint， 会 建立 对 应 的 系统 目录 。 由 于 DEFY 的 删除 策略 ，DEFY 方 案 中 没有 无 用 页 ， 因 为 任何 可 以 解密 的 页 都 被 认为 是 有 效 页 ， 任 何 删 除 页 都 由 于 安全 出 
除 tag 的 原因 无 法 解密 ， 从 而 变 成 空 几 页 。 


当 用 户 需要 创建 一 个 目录 时 ， 用 户 提供 一 个 唯一 的 口令 和 级 别名 称 ， 用 来 生成 该 级 别 的 加 密 密 铀 和 散 列 密 钥 。 


DEFY 印 载 一 个 级 别 时 ， 并 将 已 经 显示 的 、 级 别 更 高 的 级 别 同时 印 载 。 将 要 关闭 的 级 别 的 checkpoint 写 入 下 一 个 可 用 块 中 ， 并 清 零 其 RAM 中 的 数据 结构 。 


checkpoint 写 入 顺序 是 依据 从 高 级 别 到 低级 别 依次 写 入 。 
(4) 垃圾 回收 策略 


DEFY 不 像 YAFFs 一 样 执行 主动 垃圾 回收 ， 即 只 要 有 无 效 页 ， 系 统 空 采 时 惑 执 行 垃圾 回收 。 因 为 在 某 一 个 级 别 (除了 在 最 高 级 别 中 ) 中 执行 垃圾 回收 时 ， 
可 能 导致 低级 别 的 数据 被 重 写 、 回 收 。 因 此 DEFY 采 取 的 是 : 必须 是 用 户 自 己 在 最 高 级 别 手 动 启动 垃圾 回收 。 


(5) 系统 接口 


以 上 所 有 的 DEFY 操 作 都 需要 系统 接口 的 支持 : 扩展 各 目的 POSIX 接 口 或 是 需要 全 新 的 系统 API。 一 种 方法 是 开 友 全 新 的 系统 调用 ， 但 这 需要 修改 VFS9 和 重 
建 操作 系统 内 核 ， 使 得 在 移动 环境 中 不 可 用 ， 因 为 用 户 可 能 无 权限 来 重建 、 安 妆 操 作 系统 的 内 核 。 所 以 ，DEFY 采 用 一 组 用 户 级 的 工具 来 调用 IOCTL 系 统 调 
用 ， 以 此 来 传递 DEFY 专 属 的 系统 标记 。 


DEFY 方 案 的 目标 是 在 面 对 多 次 访问 敌手 ， 即 最 有 “能 力 ”的 敌手 时 ， 仍 可 以 提供 可 否认 加 密 的 特性 。 接 下 来 对 DEFY 方 案 进 行 安全 性 分 析 。 


首先 ， 为 了 应 对 单 次 访问 敌手 ， 应 该 使 得 敌手 不 可 区 分 系统 中 以 下 各 类 块 : 未 分 配 的 块 、 已 删除 的 块 、 未 显示 块 〈 即 已 分 配给 其 他 级 别 的 块 ) 。 
此 ，DEFY 在 初始 化 时 在 未 分 配 块 中 写 满 随机 数 ， 并 通过 tag 级 联 删 除 的 方式 ， 将 要 删除 的 过 时 的 数据 页 中 的 数据 安全 删除 ， 使 得 敌手 无 法 解密 ， 从 而 使 得 敌手 
无 法 区 分 以 上 三 种 数据 块 。 


为 抵抗 多 次 访问 敌手 ， 融 要 做 到 在 低级 别 中 可 以 否认 在 由 于 高 级 别 中 的 系统 操作 对 设备 造成 的 影响 ， 也 残 是 说 在 低级 别 中 必须 人 存在 一 些 相对 应 的 操作 ， 使 
得 系统 产生 与 高 级 别 中 操作 相同 的 系统 状态 。 


如 图 9-9 所 示 ， 假 设 存在 两 个 级 别 ， 级 别 0 (灰色 块 ) 和 级 别 1 (斜纹 块 ) ， 级 别 1 是 高 级 别 。 初 始 状 态 时 还 有 一 些 连 续 的 块 ，D 代 表 数 据 块 ，M 代 表 元 数据 
块 ， ”表示 政 手 无 法 区 分 的 块 。 
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c) 删除 操作 


图 9-9 ”DEFY 方 案 的 读 写 删 操 作 过 程 


由 于 读 一 个 页 时 ， 该 页 的 元 数据 也 需要 更 新 。 因 此 在 级 别 1 中 进行 1 次 读 操 作 ， 束 会 导致 级 别 0 和 级 别 1 中 的 元 数据 页 更 新 ， 这 相当 于 在 级 别 0 中 进行 2 次 读 
操作 ; 类 似 的 ， 在 级 别 1 中 进行 1 次 写 操 作 ， 也 会 导致 级 别 0 和 级 别 1 中 的 元 数据 页 更 新 ， 这 相当 于 在 级 别 0 中 进行 1 次 读 操作 和 1 次 删除 操作 ; 在 级 别 1 中 进行 1 次 
删除 操作 ， 也 会 导致 级 别 0 和 级 别 1 中 的 元 数据 页 更 新 ， 这 相当 于 人 在 级 别 0 中 进行 2 次 读 操 作 。 因 此 ， 在 级 别 1 中 无 论 进行 如 何 复杂 的 操作 ， 都 可 以 在 级 别 0 中 找 
出 相对 应 的 操作 ， 故 可 抵抗 能 力 最 强 的 多 次 访问 敌手 。 


DEFY 方 案 是 第 一 个 面向 NAND Flash 设 计 的 可 认证 的 可 否认 加 密 文 件 系统 ， 基 于 YAFFS2， 加 入 了 多 层 可 人 否认、 认证 加 密 和 安全 删除 的 特点 ， 可 以 抵抗 能 
力 最 强 的 敌手 ， 即 多 次 入 侵 政 手 。 
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第 10 章 NAND Flash 物 理 不 可 克隆 技术 


物理 不 可 克隆 功能 (Physically Unclonable Function，PUF) 的 概念 在 2002 年 前 后 被 提出 ,物理 不 可 克隆 功能 的 出 友 点 是 世界 上 没有 两 片 一 模 一 样 的 树 


叶 ， 同 样 的 道理 也 不 仔 在 两 个 一 模 一 样 的 电路 。 即 使 两 个 电路 是 按照 同一 张 设计 图 制造 的 ， 制 造 出 来 的 电路 之 间 仍 旧 人 存在 无 法 避免 的 制造 差异 ， 这 种 制造 差异 
是 在 制造 过 程 中 随机 引入 的 ， 即 使 制造 三 商 也 无 法 重 现 相同 的 制造 差异 。 


如 果 只 用 一 句 话 来 摘 述 物理 不 可 克隆 功能 的 概念 ， 最 贴切 的 描述 应 该 是 “物理 不 可 克隆 功能 是 一 个 实体 的 指纹 ”。 正 如 和 人 类 的 指纹 一 样 ， 它 的 功能 瓯 是 用 
来 区 分 个 体 之 间 的 差异 ， 同 时 这 个 指纹 特征 是 与 生 俱 来 的 ， 当 电路 制造 出 来 的 时 候 电路 指纹 也 就 存在 了 ， 它 由 独一无二 的 制造 差异 决定 。 指 纹 还 有 一 个 特点 就 
是 不 可 克隆 ， 没 有 人 能 够 制造 出 两 个 具有 相同 指纹 的 实体 。 因 此 ， 物 理 不 可 克隆 功能 是 一 个 物理 实体 内 在 的 、 不 可 克隆 的 特征 形式 的 体现 。 


物理 不 可 克隆 功能 中 “不 可 克隆 ”是 这 个 概念 的 一 个 创新 。 在 物体 实体 的 制造 过 程 中 ， 由 于 随机 、 不 可 控 因 素 的 影响 ， 即 使 使 用 极其 精细 的 控制 手段 ， 也 
无 法 创造 出 两 个 完全 一 样 的 实体 。 通 常 ， 这 些 因素 的 影响 都 是 很 微小 的 ， 但 却 会 在 电路 中 留 下 随机 的 微小 差 蛋 ， 精 确 地 提取 这 些微 小 差异 就 可 以 作为 这 个 物理 
实体 的 内 在 特征 。 物 理 不 可 克隆 功能 的 一 个 基本 目标 就 是 产生 一 种 足够 精度 的 提取 算法 能 够 有 效 地 提取 这 些微 小 甜 异 。 


物理 不 可 克隆 功能 通过 提取 制造 差异 的 随机 性 为 每 一 个 密码 设备 提供 一 个 “设备 指纹 ”， 作 为 设备 的 物理 信任 根 。 因 此 ， 物 理 不 可 克隆 功能 为 很 多 密码 安 
全 系统 的 设计 提供 了 新 的 解决 思路 ， 如 随机 数 提取 、 设 备 认 证 、 设 备 安全 局 动 、 必 片 防伪 、 信 息 隐藏 、 密 钥 提 取 、 密 钥 人 存储 等 应 用 场景 。 


物理 不 可 克隆 功能 的 英文 翻译 中 “Function” 具 有 上 函数 的 意思 ， 有 输入 和 输出 ， 物 理 不 可 克隆 功能 也 具有 输入 和 输出 ， 输 入 叫 作 挑战 (challenge) ， 输 
出 叫 作 响 应 (response) ， 相 应 的 输入 和 输出 称 为 一 对 挑战 -响应 对 (challenge-response pair) 。 


综 上 所 述 ， 物 理 不 可 克隆 功能 的 概念 可 以 归纳 成 下 面 三 氮 。 

1) 在 物理 实体 制造 过 程 中 ， 人 存在 不 可 避免 的 随机 制造 差异 ， 为 不 同 的 物理 实体 赋予 不 同 的 “指纹 ”信息 。 
2) 制造 差异 是 不 可 克隆 的 ， 即 使 是 物理 实体 设计 生产 者 也 无 法 制造 出 完全 一 样 的 物理 实体 。 

3) 物理 实体 内 在 的 特征 信息 可 以 通过 挑战 -响应 机 制 反 馈 给 使 用 者 。 


物理 不 可 克隆 功能 因为 其 新 颖 的 概念 吸引 了 广泛 的 关注 ， 近 年 来 友 展 迅速 。 研 究 人 员 构 建 出 了 各 种 各 样 的 物理 不 可 克隆 功能 来 应 对 不 同 平台 的 需求 ， 同 时 
为 了 使 得 物理 不 可 克隆 功能 更 稳定 更 有 效 地 集成 到 安全 系统 中 ， 制 造 差 异 的 提取 方法 得 到 不 断 改进 ， 物 理 不 可 克隆 功能 的 评估 体系 也 不 断 趋 于 完善 。 


随 着 基于 NAND Flash 的 存储 设备 的 普遍 应 用 ， 学 术 界 也 逐渐 开始 对 NAND Flash 芯 片 的 相关 物理 不 可 克隆 功能 的 原理 进行 研究 ， 并 且 提 出 了 提取 随机 
数 、 提 取 设 备 指纹 、 信 息 隐藏 、 提 取 密 钥 等 应 用 。 接 下 来 分 别 对 最 新 的 NAND Flash 物 理 不 可 克隆 功能 的 物理 原理 、 实 际 应 用 方案 进行 详细 讲解 。 


10.1 NAND Flash PUF 相 关 原 理 概述 


NAND Flash 物 理 不 可 克隆 功能 (PUF) 简称 为 NFPUF， 其 物理 来 源 主要 是 NAND Flash 存 储 单元 的 物理 组 成 结构 ， 以 及 NAND Flash 芯 片 对 各 个 存储 单 
元 的 组 织 结 构 。 


有 关 NAND Flash 存 储 单元 的 物理 组 成 ， 和 存储 单元 的 组 织 结构 ， 编 程 、 读 、 探 除 操作 的 原理 参见 4.2 书 。 


10.1.1 NAND Flash 存 依 单 元 的 国 值 电压 


对 于 浮 置 栅 极 中 没有 电 共 的 存储 单元 来 说 ， 在 通常 状态 下 源 极 与 漏 极 之 间 没 有 导电 通路 。 在 编程 操作 过 程 中 ， 在 控制 栅 极 上 和 漏 极 上 施加 足够 大 的 偏 置 电 
压 (VGS) ， 在 底层 的 硅 基 中 感应 出 电 丛 ， 源 极 和 漏 极 才能 导 通 。 电 子 从 源 极 流向 漏 极 ， 形 成 源 极 与 漏 极 间 的 电流 (lps) 。 编 程 操 作 过 程 成 功 时 ， 导 电 通 道 
中 形成 的 电压 称 为 该 存储 单元 所 在 晶体 管 的 国 值 电压 ， 记 作 VT。 


由 于 浮 置 栅 极 中 电 倚 量 友 生变 化 ， 人 存储 单元 的 电压 也 会 随 忆 改变。 向 浮 置 栅 极 中 注入 电子 时 ， 晶 体 管 的 电压 上 升 ， 并 且 上 升 的 幅度 与 所 存储 的 电荷 量 成 正 
比 。 昂 体 管 电压 的 变化 导致 源 极 与 漏 极 之 间 电 流 的 变化 ， 因 此 ， 通 过 判断 电流 的 大 小 束 可 以 判断 该 晶体 管 中 是 否 存储 了 数据 。 

图 10-1 表 示 的 是 读 操作 过 程 中 源 极 与 漏 极 间 的 电流 随 着 电压 的 变化 情况 。 一 个 存储 单元 含有 两 个 逻辑 状态 ， 即 编程 状态 (Programmed state) 和 擦 除 状 
态 (Erased state) 。 处 于 编程 状态 的 晶体 管 的 国 值 电压 记 作 Vtpb， 处 于 探 除 状态 的 国 值 电压 记 作 Vte。 读 存储 单元 中 数据 时 ， 需 要 将 施加 在 控制 栅 极 的 俩 置 电 
压 〈 记 作 Vread) 控制 在 Vtpf0Vte 之 间 。 寿 源 极 与 漏 极 之 间 电 流 1DS 足 够 大 (一 般 在 几 十 微 安 左右 ) ， 则 认为 该 存储 单元 中 没有 存储 电 人 向 ， 读 作 远 辑 状 
人 态 “1”， 而 当 读 取 的 电流 较 小 ， 则 认为 该 存储 单元 中 存储 电 丛 ， 读 作 远 辑 状态 “0”。 
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图 10-1 读 操 作 过 程 中 源 极 与 漏 极 间 的 电流 电压 变化 
为 了 读 取 一 个 存储 单元 中 的 数据 ， 必 须 首 先 确定 该 存储 单元 晶体 管 的 相对 电压 ， 并 上 且 与 标准 的 阅 值 电压 作对 比 。 因 此 ，NAND Flash 设 置 了 一 些 参考 存储 
单元 ， 来 确定 上 述 参 考 电压 的 值 。 这 个 对 比 的 过 程 称 作 感应 ， 并 且 通 过 感应 放大 器 来 完成 。 


10.1.2 NAND Flash 存 储 单元 之 间 的 相互 干扰 


为 了 缩短 NAND Flash 存 取 时 间 ， 提 高 单位 面积 中 存储 单元 的 存储 密度 ，NAND Flash 并 不 是 对 每 个 单元 进行 单独 的 存 取 操作 ， 而 是 对 一 定数 量 的 存 取 单 
元 进行 集体 的 读 写 或 者 擦 除 操作 。NAND Flash 将 各 个 存储 单元 组 织 成 阵列 的 形式 ， 将 一 串 存储 单元 的 控制 栅 极 都 串联 在 一 条 字 线 上 ， 这 一 串 存 储 单元 (如 
512B、2KB、4KB 等 ) 称 为 一 页 (Page) ， 即 同一 页 上 的 所 有 存储 单元 共享 一 条 字 线 。 相 邻 的 多 个 页 (如 32 页 、64 页 、128 页 等 ) 组 成 一 块 (Block) ， 几 干 
个 (如 4096、8192 个 等 ) 块 组 成 一 个 NAND Flash 芯 片 。 


在 编程 过 程 中 ， 将 待 写 入 数据 的 存储 单元 所 在 页 的 字 线 上 的 电压 提高 到 一 定 程度 (如 20V 左 右 ) ， 而 不 写 入 数据 的 页 的 字 线 保持 低 电 压 (如 10V 左 右 ) ， 
由 于 一 页 的 存储 单元 共享 一 条 字 线 ， 所 以 NAND Flash 的 编程 操作 的 基本 单位 是 一 页 。 在 编程 过 程 中 ， 由 于 在 待 写 入 数据 的 存储 单元 所 在 页 的 字 线 上 施加 高 电 
压 ,， 而 且 一 个 块 中 各 个 页 的 存储 单元 之 间 是 相互 连接 的 ,不 可 避免 地 会 在 其 相 邻 页 的 存储 单元 的 字 线 上 形成 间接 的 门 电压 ,执行 多 次 编程 操作 后 ， 未 被 编程 页 
中 的 存储 单元 束 可 能 会 发 生 位 翻转 现象 ， 这 是 一 个 量变 到 质变 的 过 程 。 


浮 置 栅 极 型 晶体 管 的 工作 原理 是 利用 浮 栅 上 是 否 存 储 有 电 倚 或 存储 电 倚 的 多 少 来 改变 晶体 管 的 冰 值 电压 ， 从 而 改变 晶体 管 的 外 部 特性 ， 目 前 其 已 经 成 为 非 
易 失 性 半导体 存储 器 的 基础 器 件 结 构 。 


浮 置 栅 极 型 晶体 管 也 人 存在 一 些 不 足 : 


1) 各 种 泄漏 机 理 的 人 存在， 使 得 电子 在 浮 置 栅 极 中 的 保持 特性 受到 严重 影响 ， 伴 随 反 复 地 探 写 ， 导 电 通 道 的 绝缘 膜 会 友 生 损伤 ， 通 过 这 一 损伤 部 分 可 能 皮 
生 浮 置顶 极 内 的 电子 出 现 泄漏 的 现象 。 


2) 浮 置 栅 极 上 电子 陷阱 的 存在 往往 导致 栅 极 失去 控制 。 
3) 氧化 层 的 缺陷 可 能 导致 绝缘 特性 变 差 ， 有 可 能 导致 电子 无 法 到 达 浮 置 栅 极 。 


现 有 的 NAND Flash 采 用 的 浮 置 栅 极 结构 单元 仍 面 临 各 种 各 样 的 技术 课题 ， 比 如 毗邻 浮 置 栅 极 间 的 耦合 现象 导致 的 误 写 入 问题 ， 浮 置 栅 极 间 的 距离 过 于 小 
而 使 绝 绿 膜 和 控制 门 难 以 形成 等 。 


10.2 NAND Flash PUF 应 用 


随 着 学 术 界 对 NAND Flash 内 部 存储 单元 结构 、 组 织 结构 的 研究 ， 以 及 对 存储 单元 内 部 操作 机 理 的 深入 了 解 ， 物 理 不 可 克隆 功能 的 应 用 逐渐 延伸 到 了 
NAND Flash 中 。 近 年 来 ， 学 术 界 针对 NAND Flash 物 理 不 可 克隆 提出 了 提取 设备 指纹 、 提 取 随 机 数 、 信 息 隐藏 、 提 取 密 钥 等 应 用 ， 接 下 来 对 最 新 的 、 具 有 代 
表 性 的 NAND Flash 物 理 不 可 克隆 功能 的 应 用 方案 进行 详细 的 介绍 。 


10.2.1 ”提取 设备 指纹 


电子 产品 已 广泛 应 用 在 人 们 的 学 习 、 工 作 、 生 活 中 ， 如 智能 手机 、 照 相机 、 音 乐 设备 、 个 人 计算 机 等 。 随 着 个 性 化 服务 、 数 字 版 权 管理 和 认证 机 制 等 应 用 
的 普及 ， 对 电子 设备 也 需要 进行 区 分 。 现 在 大 多 数 电 子 产 品 都 是 以 NAND Flash 心 片 作 为 存储 设备 ， 所 以 利用 NAND Flash 蕊 片 来 提取 设备 指纹 ， 从 而 对 电子 


设备 进行 标识 、 伪 造 检 测 具 有 广泛 的 应 用 前 景 。 
1.Prabhu 等 人 的 方案 


Prabhu 等 人 在 2011 年 提出 了 利用 NAND Flash 物 理 不 可 克隆 功能 (NFPUF) ， 不 需要 对 NAND Flash 的 传统 电路 做 任何 改变 ， 束 可 以 提取 设备 指纹 
(device fingerprint) 的 方案 。 他 们 提 到 了 一 个 利用 NFPUF 提 取 设 备 指纹 的 实际 应 用 场景 。 


图 10-2 列 举 了 一 种 NAND Flash 忌 片 销 售 的 假设 模型 。 可 信和 的 NAND Flash 攻 片 制造 商 通 过 不 可 信 的 产品 销售 渠道 来 销售 NAND Flash 芯 片 ， 但 是 产品 供 
应 链 中 也 不 可 避免 地 掺 杂 着 伪造 者 生产 的 质量 差 的 、 假 冒 的 NAND Flash 心 片 。 通 常 NAND Flash 心 片 一 般 是 集成 在 电子 设备 中 ， 用 作 存 储 数 据 ， 所 以 购买 
NAND Flash 心 片 的 客户 大 多 数 是 生产 电子 设备 的 








图 10-2 ”一 种 NAND Flash 芯 片 销 售 的 假设 模型 


制造 商 ， 而 不 是 电子 设备 的 终端 用 户 。 所 以 ， 电 子 设备 制造 商 以 及 终端 用 户 需要 一 种 鉴别 能 力 ， 可 以 识别 出 伪造 者 生产 的 质量 差 的 、 假 冒 的 NAND Flash 
必 片 ， 以 此 保证 NAND Flash 心 片 以 及 电子 设备 的 可 靠 性 。 如 果 伪 造 者 可 以 仿造 正规 NAND Flash 心 片 制造 商 的 两 标 ， 销 售 假冒 心 片 ， 以 次 充 好 ,谋取 利益 ， 
这 将 给 电子 设备 的 终端 用 户 市 来 极 大 的 系统 不 可 靠 性 ， 甚 至 会 市 来 信息 的 丢失 。 


正规 的 NAND Flash 心 片 制造 商 应 该 具备 可 以 识别 其 生成 的 心 片 的 能 力 。 所 以 ， 从 每 一 个 正规 的 NAND Flash 心 请 中 提取 一 个 有 效 的 “签名 ” ， 将 会 是 一 
个 有 效 的 解决 办 法 。 电 子 设备 制造 商 在 生产 过 程 中 拥有 对 NAND Flash 心 片 进 行 直接 访问 、 操 作 的 能 力 ， 如 可 以 读 、 写 、 擦 除 NAND Flash 心 片 的 任意 物理 位 
置 。 他 们 可 以 根据 以 下 过 程 来 识别 伪造 的 NAND Flash 疙 片 。 


1) NAND Flash 心 片 制造 商 从 每 一 个 NAND Flash 心 片 中 随机 选择 一 捉 存 储 单元 的 物理 地 址 ， 并 利用 NFPUF 来 提取 心 瞩 的 “签名 ”， 并 用 一 个 唯一 的 序 
列 号 标识 该 釜 名 ， 可 将 序列 号 写 入 一 个 一 次 性 写 人 存储 器 件 中 。 


2) NAND Flash 心 片 购买 者 为 了 验证 NAND Flash 心 片 的 真 仿 ， 向 制造 商 提供 该 心 片 的 序列 号 ， 然 后 制造 商 向 购买 者 返回 一 串 NAND Flash 人 存储 单元 物理 
地 址 。 


3) NAND Flash 芯 片 购买 者 利用 得 到 的 一 串 存储 单元 物理 地 址 ， 也 利用 NFPUF， 从 NAND Flash 芯 片 中 提取 “签名 ″” ， 并 将 自己 生成 的 “签名 ”返回 给 
制造 商 。 


4) NAND Flash 芯 片 制造 商 对 比 购买 者 返回 的 “签名 ”和 所 存储 的 对 应 序列 号 的 “签名 ”， 返 回 NAND Flash 芯 片 的 真 伪 结 果 。 
一 个 实用 的 NFPUF 必 须 具备 以 下 条 件 : 


1) NFPUF 应 该 可 以 高 区 别 度 来 区 分 不 同 的 心 片 。 也 就是 说 ， 从 两 个 不 同 的 心 片 中 或 者 从 一 个 心 片 的 不 同位 置 所 提取 的 “签名 ”， 应 该 是 随机 且 不 同 的 。 
同时 ， 从 一 个 心 片 的 相同 位 置 提取 的 多 次 “签名 ”应 该 是 稳定 的 ， 即 使 不 是 完全 一 样 ， 也 应 该 是 非常 类 似 的 。 


2) NFPUF 提 取 “ 签 名 ”应 该 是 快速 的 。 如 果 提 取 一 次 签名 需要 几 个 小 时 ， 束 不 适用 了 。 
3) 对 于 伪造 者 来 说 ,伪造 一 个 心 刻 的 “签名 ”是 困难 的 。 而 且 “ 签 名 ”不 能 保存 于 心 片 中 ， 以 防止 重 放 攻 击 。 


4) NFPUF 提 取 “ 签 名 ”的 过 程 不 能 对 芯片 造成 大 的 损害 。NAND Flash 中 的 数据 块 都 有 一 定 的 擦 写 寿命 ， 如 果 提 取 过 程 代价 较 大 ， 也 会 使 得 NFPUF 不 适 
用 。 


为 了 提取 NAND Flash 芯 片 的 设备 指纹 ，Prabhu 等 人 利用 了 一 个 含有 两 个 NAND Flash 插 槽 的 开发 板 ， 这 个 开发 板 又 连 着 一 个 运行 着 Linux 操 作 系 统 的 
Xilinx XUP 开 发 板 。 这 个 开发 板 的 系统 通过 一 个 在 FPGA 上 运行 的 内 存 控制 器 ， 可 以 任意 地 对 NAND Flash 发 送 编程 、 读 、 擦 除 命 令 ， 其 实际 测量 的 时 间 精 度 是 
10ns。 


为 了 提高 NAND Flash 心 片 的 存储 密度 ， 各 个 存储 单元 的 间 隅 都 非 澡 小 ， 这 导致 存储 单元 晶体 管 中 栅 极 与 硅 衬 底 之 间 的 二 氧化 硅 绝缘 层 厚 度 存 企 微小 差 
异 。 由 于 电容 耦合 等 原因 ， 融 会 造成 各 个 仓储 单元 容易 遭受 编程 干扰 、 读 干扰 等 影响 。 也 残 是 说 ， 在 NAND Flash 中 对 存储 单元 进行 编程 或 者 读 操作 过 程 中 ， 
未 选择 的 字 线 上 可 能 也 会 被 施加 间接 的 电压 ， 从 而 导致 该 字 线 上 每 一 个 仓储 单元 的 氧化 层 处 于 一 种 轻微 的 编程 作用 力 之 下 ， 但 是 如 果 经 过 多 次 类 似 的 操作 ， 这 
些 编程 和 读 操 作 过 程 中 的 干扰 影响 可 能 会 造成 某 些 存 储 单元 的 位 翻转 现象 。 


Prabhu 等 人 测试 了 7 种 提取 设备 指纹 的 方法 ， 下 面 主 要 介绍 其 中 的 几 种 。 
(1) 编程 干扰 (program disturb) 


由 于 在 NAND Flash 心 片 制造 过 程 中 ， 各 个 存储 单元 晶体 管 中 氧 化 层 厚度 的 微小 差异 ， 各 个 仓储 单元 对 其 相 邻 页 的 重复 编程 造成 的 控制 | 门 电压 变化 影响 的 
忍耐 能 力 不 同 ， 对 于 编程 操作 来 说 ， 受 干扰 影响 最 大 的 是 与 目标 编程 页 相 邻 的 物理 页 。 为 了 验证 编程 操作 对 存储 单元 造成 的 影响 ， 他 们 提出 了 如 下 算法 。 


首先 对 NAND Flash 的 一 块 进行 擦 除 操 作 ， 使 该 块 所 有 页 中 存储 单元 内 的 数据 均 变 为 逻辑 状态 “1”。 假 设 A 页 和 B 页 是 该 块 内 物理 上 相 邻 的 两 页 ， 对 该 块 
内 的 A 页 进行 多 次 编程 操作 ， 将 A 页 中 数据 写成 全 “0”。 每 次 对 A 页 进行 编程 操作 之 后 ， 读 B 页 数据 ， 观 察 B 页 上 各 存储 单元 是 否 故 生 了 位 翻转 现象 ， 即 存储 的 
数据 状态 是 否 由 “1” 变 为 “0”。 若 B 页 上 某 存储 单元 发 生 了 位 翻转 现象 ， 记 录 此 时 对 A 页 的 编程 次 数 ， 若 对 A 页 若干 次 编程 操作 后 B 员 上 的 某 存 储 单元 仍然 没 
有 友 生 位 翻转 现象 ， 则 记录 该 存储 单元 的 编程 次 数 为 0。 最 后 将 B 页 的 各 个 存储 单元 友 生 位 翻转 现象 时 对 应 的 A 页 的 编程 数组 合 起 来 ， 构 成 此 NAND Flash 
的 一 个 “签名 ”， 称 为 设备 指纹 。 算 法 伪 代 码 如 下 : 


EraseBlock (TheBlock) 
for Cycle = 0 http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16547/0EBPS/Text/... 10000 do 
ProgRAMAl11Zeroes (Page A) 
bits = ReadPage (Page B) 
for b= 1 http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16547/0EBPS/Text/... BitsPerPage do 
if bits[b]==0 then 
Signature[b] = Cycle 
end if 
end for 
end for 


由 于 电子 噪声 的 影响 ， 对 同一 NAND Flash 的 相同 块 和 页 进行 两 次 指纹 提取 操作 ， 所 提取 的 指纹 信息 不 会 完全 一 样 ， 但 是 两 组 指纹 信息 有 很 大 的 相关 性 。 


PCD = EL(X -1,)(Y — 1,)] 
定义 


定 ?9， ”为 一 组 数字 指纹 信息 对 ， 根 据 公 式 计算 其 相关 系数 。 根 据 计算 的 相关 系数 大 小 ， 可 以 判断 两 组 数字 指纹 信息 是 否 取 自 同一 
NAND Flash 芯 片 的 同一 块 和 页 。 相 关系 数 越 趋 近 于 1， 说 明 两 种 指纹 越 相近 ， 反 之 ， 相 关系 数 越 趋 近 于 0， 说 明 两 种 指纹 差别 越 大 ， 


这 也 是 “数字 指纹 ”的 含义 所 在 一 一 判断 两 次 提取 的 指纹 是 否 来 自 同 一 NAND Flash 芯 片 的 同 块 同 页 ， 不 是 根据 数值 的 精确 比 对 来 确定 的 ， 而 是 通过 对 比 
两 次 提取 的 数据 之 间 的 相关 性 而 确定 的 ， 这 与 指纹 识别 技术 的 原理 非常 类 侯 。 


图 10-3 表 示 的 是 两 组 指纹 之 间 的 相关 性 。 横 坐标 与 纵 坐 标的 合 义 是 执行 的 一 页 中 存储 单元 的 数据 友 生 位 翻转 现象 时 相 邻 页 的 编程 次 数 。 左 图 表示 的 是 从 同 
一 NAND Flash 心 厂 的 相同 块 和 页 中 提取 的 两 组 指纹 的 相关 性 ， 两 组 指纹 相关 性 是 0.94。 右 图 表示 的 是 从 不 同 NAND Flash 心 片 提 取 的 两 组 指纹 的 相关 性 ， 两 
组 指纹 相关 性 是 0.012。 
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图 10-3 ”两 组 指纹 之 间 的 相关 性 


利用 编程 干扰 提取 的 设备 指纹 基于 每 一 个 存储 单元 在 经 受 相 邻 页 编程 过 程 时 的 敏感 性 。 昌 然 此 方法 可 以 提取 一 个 NAND Flash 心 片 中 上 干 物理 页 中 的 任意 
一 页 ， 而 且 每 一 个 物理 页 也 有 着 成 干 上 万 个 存储 单元 ， 但 是 所 能 提取 的 指纹 数量 仍然 与 NAND Flash 心 片 的 容量 成 正比 。 


由 于 需要 对 一 个 物理 页 进行 几 干 次 的 编程 操作 (一 般 一 次 编程 操作 持续 200ys) ， 而 且 还 需要 判断 相 邻 页 数据 的 位 翻转 情况 ， 所 以 利用 编程 干扰 来 提取 设 
备 指纹 需要 进行 1 ~ 5 分 钟 。 为 了 加 快速 度 ， 以 及 在 保证 不 同 指纹 信息 区 分 度 的 前 提 下 ， 可 以 将 重复 编程 次 数 的 上 限 设 为 5000 次 ， 这 样 束 能 将 提取 一 次 设备 指 
纹 的 操作 时 间 减 少 到 ?0s 内 。 


如 果 政 手 要 伪造 一 个 NAND Flash 心 片 的 指纹 信息 ， 伪 造 者 需要 提取 并 存储 心 片 所 有 的 指纹 数据 。 由 于 从 每 一 个 存储 单元 提取 的 指纹 信息 多 于 1 位 ， 如 图 
10-3 所 示 ， 每 个 指纹 数据 在 2000 ~ 10000 之 间 ， 所 以 每 个 存储 单元 的 指纹 数据 需要 10 位 。 这 就 导致 如 果 要 存储 一 个 NAND Flash 心 片 所 有 存储 单元 的 指纹 信 
息 ， 所 需要 的 存储 容量 反而 大 于 该 NAND Flash 的 存储 容量 。 所 以 ， 为 了 防止 敌手 伪造 捐 纹 信息 ， 心 片 制造 商 可 以 随机 选择 部 分 物理 页 。 


Prabhu 等 人 还 计算 了 指纹 信息 粹 。 他 们 用 两 位 表示 从 每 一 个 存储 单元 提取 的 指纹 数据 ， 这 样 每 个 指纹 数据 残 有 4 种 可 能 。 利 用 以 下 公式 来 计算 所 提取 指纹 


言 息 的 炳 : 
H=- >》 pnp. 


i=0.,1.2,3 
其 中 p 读 示 一 个 经 过 量化 后 的 指纹 数据 的 值 为 的 概率 。 经 计算 ， 粒 值 接近 2。 这 表明 指纹 数据 不 能 被 压缩 ， 所 以 伪造 者 也 不 能 通过 人 储 压缩 后 的 指纹 信息 
来 减少 所 需要 的 存储 容量 。 
利用 编程 干扰 的 方法 来 提取 设备 指纹 ， 虽 然 需要 对 NAND Flash 的 一 页 进行 多 次 编程 操作 ， 但 是 只 需要 对 此 页 所 在 的 块 进行 一 次 擦 除 操作 。 通 过 Prabhu 等 
人 的 测试， 这 并 没有 对 此 块 存储 数据 的 可 靠 性 市 来 较 大 的 影响 。 
(2) 读 干扰 (read disturb) 
Prabhu 等 人 提出 的 第 二 个 方法 是 依靠 读 干 扰 来 提取 设备 指纹 。 为 了 验证 读 操作 对 存储 单元 造成 的 影响 ， 他 们 提出 了 如 下 算法 。 


首先 对 NAND Flash 的 一 块 进行 擦 除 操 作 ， 使 该 块 所 有 页 中 存储 单元 内 的 数据 均 变 为 逻辑 状态 “1”。 用 随机 数 对 该 块 的 所 有 页 进行 编程 。 然 后 对 此 块 的 
所 有 页 进行 一 干 万 次 读 操作 ， 每 进行 1000 次 读 操 作 后 ， 判 断 此 块 中 所 有 页 数据 是 否 友 生 了 位 翻转 现象 。 若 某 个 存储 单元 发 生 了 位 翻转 现象 ， 即 存储 的 数据 状态 
由 “1” 变 为 “0”， 或 者 由 “0” 变 成 “1”， 则 记录 此 存储 单元 的 位 置 、 所 在 页 号 及 读 操作 次 数 。 最 终 仍然 没有 发 生 位 翻转 现象 的 存储 单元 ， 则 记录 该 存储 单 
元 的 读 操 作 次 数 为 0。 最 后 将 此 块 内 所 有 存储 单元 发 生 位 翻转 现象 时 对 应 的 读 操作 数组 合 起 来 ， 构 成 此 NAND Flash 心 片 的 一 个 “签名 ”， 也 称 为 设备 指纹 。 


实验 测 得 读 干 扰 对 存储 单元 造成 的 影响 比 编程 干扰 小 得 多 。 从 同一 个 NAND Flash 块 中 提取 的 多 个 指纹 信息 的 平均 相关 性 是 0.98， 而 从 不 同 NAND Flash 
块 中 提取 的 多 个 指纹 信息 的 相关 性 是 0。 


读 干 扰 提取 指纹 信息 方法 的 最 大 缺点 是 速度 慢 。 从 一 个 MLC 类 型 NAND Flash 心 片 中 提取 一 个 指纹 大 约 需 要 6 小 时 ， 也 只 能 观察 到 3 ~ 7 个 存储 单元 发 生 位 
翻转 现象 。 而 SLC 类 型 NAND Flash 心 片 的 存储 单元 不 会 被 读 操 作 所 影响 ， 实 验 测 得 无 法 用 读 干 扰 方 法 从 SLC 类 型 心 片 中 提取 有 效 的 指纹 信息 。 


用 读 干 扰 方法 来 提取 指纹 信息 ， 虽 然 不 会 对 心 片 造成 破坏 (不 会 对 存储 单元 浮 置 栅 极 的 电子 造成 影响 ) ， 但 是 速度 慢 、 影 响 小 ， 所 以 不 适用 。 
(3) 编程 操作 延 时 (program operation latency) 
编程 操作 延 时 方法 是 指 每 次 对 一 页 中 的 1 位 进行 编程 ， 并 记录 其 编程 操作 的 延 时 。 编 程 操作 延 时 方法 又 分 为 两 种 情况 : 对 一 页 操作 和 对 多 页 操作 。 


对 一 页 操作 的 编程 延 时 方法 的 步骤 是 : 首先 擦 除 一 个 块 ， 然 后 用 1 位 “0”、 其 余 全 是 “1” 对 此 页 进行 第 一 次 编程 ， 之 后 用 2 位 “0”、 其 余 全 是 “1” 对 
此 页 进行 第 2 次 编程 ， 以 此 类 推 。 分 别 记录 每 一 次 编程 操作 的 用 时 并 进行 量化 ， 形 成 一 个 指纹 信息 。 


对 多 页 操作 的 编程 延 时 方法 的 步骤 是 : 首先 擦 除 一 个 块 ， 然 后 用 n 位 “0”、 其 余 全 是 “1” 对 第 n (n=1，2，3，…，64) 页 进行 一 次 编程 。 分 别 记录 每 
一 次 编程 操作 的 用 时 并 进行 量化 ， 形 成 一 个 指纹 信息 。 


通过 对 SLC 和 MLC 类 型 NAND Flash 进 行 实验 验证 ， 从 同一 页 中 提取 的 指纹 信息 的 相关 性 在 0.83 ~ 0.84 之 间 ， 从 不 同 页 中 提取 的 指纹 信息 的 相关 性 在 0.02 
~ 0.03 之 间 。 编 程 操作 延 时 法 的 相关 性 差距 虽然 比 编程 干扰 法 小 ， 但 是 也 足以 对 从 不 同 页 提取 的 指纹 进行 区 分 。 


利用 编程 操作 延 时 法 从 一 个 块 中 提取 指纹 信息 ， 需 要 执行 上 干 次 编程 操作 ， 并 且 用 时 超过 5s。 在 实验 中 友 现 ， 对 SLC 和 MLC 类 型 NAND Flash 来 说， 编程 
操作 延 时 法 利用 的 是 NAND Flash 心 请 存储 单元 的 阵列 结构 造成 的 心 片 乙 间 的 差异 性 ， 所 以 只 需 进行 100 次 操作 融 能 保证 相同 来 源 指纹 的 相关 性 ， 而 且 如 果 操 
作 超 过 1000 次 ， 反 而 会 增加 不 同 来 源 指纹 的 相关 性 。 


利用 编程 操作 延 时 法 来 提取 设备 指纹 的 优点 是 速度 快 (1 ~ 3s 束 可 以 生成 一 个 指纹 信息 ) 和 对 心 片 的 损害 小 (只 需要 对 一 个 块 进行 一 次 擦 除 编程 周期 操 
作 ) 。 但 缺点 是 由 此 生成 的 指纹 的 粹 较 低 ， 比 较 容 易 伪造 。 


(4) 其 他 生成 设备 指纹 的 方法 
Prabhu 等 人 还 提 到 了 其 他 4 种 可 利用 NFPUF 来 生成 设备 指纹 的 方法 。 但 是 通过 实验 效果 来 看 并 不 好 ， 只 简单 介绍 一 下 。 


探 除 延 时 法 。 利 用 对 每 一 个 块 进行 探 除 操作 的 延 时 来 提取 设备 指纹 ， 但 是 由 于 不 同 块 的 探 除 延 时 差别 不 大 ， 而 且 每 一 个 块 的 擦 除 延 时 不 是 固定 的 ， 所 以 本 
方法 个 太 适 用 。 


读 延 时 法 。 利 用 对 每 一 个 页 进行 读 操作 的 延 时 来 提取 设备 指纹 ， 但 是 对 于 一 个 NAND Flash 心 片 来 说 ， 不 同 页 的 读 延 时 差别 不 大 ， 甚 至 对 于 SLC 类 型 心 
来 说 所 有 页 的 读 延 时 是 固定 的 ， 所 以 本 方法 也 不 太 适 用 。 


全 页 编程 延 时 法 。 与 编程 操作 延 时 法 不 同 ， 本 方法 是 同时 将 一 页 中 的 数据 编程 为 “0”， 并 记录 不 同 页 的 延 时 情况 ， 但 是 不 同 页 的 差别 也 很 小 ， 也 不 适 
用 。 


编程 擦 除法 。 他 们 测试 了 每 个 存储 单元 对 编程 擦 除 操作 的 敏感 性 ， 但 是 这 种 方法 需要 消耗 几 小 时 ， 并 且 会 给 NAND Flash 块 造成 不 可 挽回 的 损害 ， 也 比较 
容易 伪造 ， 所 以 也 不 适用 。 
(5) 总 结 


总 结 本 文 提 出 的 7 种 利用 NFPUF 从 NAND Flash 心 片 中 提取 设备 指纹 的 方法 ， 比 较 适 用 的 是 编程 干扰 法 以 及 编程 操作 延 时 法 。 其 中 编程 干扰 法 提取 的 不 同 
指纹 的 区 别 度 最 大 ， 但 是 用 时 较 长 ， 适 用 于 对 时 间 要 求 较 低 的 应 用 场景 。 编 程 操 作 延 时 法 速度 最 快 ， 可 适用 于 对 时 间 要 求 较 高 的 应 用 场景 。 


2.Wang 等 人 的 方案 


通常 利用 PUF 方 法 来 生成 设备 指纹 的 方案 都 需要 增加 额外 的 电路 ， 如 基于 SRAM 的 方案 ， 以 将 模拟 信号 转换 为 物理 信号 。 基 于 NAND Flash 
PUF (NFPUF) 来 生成 设备 指纹 的 方法 ， 可 以 直接 应 用 在 现 有 的 NAND Flash 必 片上， 而 不 需要 对 现 有 的 具备 NAND Flash 忌 片 的 设备 做 任何 改变 。 


为 了 增加 NAND Flash 心 片 的 存储 容量 ，NAND Flash 的 存储 密度 逐渐 增加 。 在 制造 过 程 中 的 微小 的 差异 性 ， 如 浮 置 栅 极 下 的 隧道 氧化 层 厚度 、 控 制 栅 极 
的 耦合 率 等 ， 体 现在 各 个 NAND Flash 心 片 中 的 存储 单元 的 阅 值 电压 不 同 ， 甚 至 是 相同 心 片 中 的 不 同位 置 的 存储 单元 的 阅 值 电压 也 不 同 。 正 是 由 于 存储 单元 的 
阅 值 电压 不 同 ， 各 个 存储 单元 在 编程 操作 时 需要 的 时 间 也 丈 不 一 样 。 


NAND Flash 中 每 一 个 存储 单元 的 闪 值 电压 各 不 相同 ， 这 就 造成 每 一 个 存储 单元 表示 多 辑 状态 “0” 时 ， 要 求 浮 置 栅 极 中 所 需要 存储 的 电 奏 容量 也 不 相 
同 。 如 果 在 “编程 状态 ”时 ， 一 个 存储 单元 的 浮 置 栅 极 中 的 电 奏 容量 不 充足 ， 从 而 这 个 存储 单元 的 电压 也 会 变 得 不 稳定 ， 那 么 它 束 会 进入 一 个 不 稳定 状态 : 可 
能 被 读 作 逻辑 状态 “1”， 也 可 能 被 读 作 逻辑 状态 “0”。Wang 等 人 就 是 利用 NAND Flash 心 片 中 存储 单元 的 阐 值 电压 不 同 ， 以 及 编程 状态 时 的 不 稳定 状态 来 
生成 设备 指纹 以 及 随机 数 。 由 此 生成 的 设备 指纹 信息 不 随 温度 、 时 间 而 变化 ， 而 且 NAND Flash 含 有 大 量 的 存储 单元 ， 所 以 从 一 个 NAND Flash 心 片 中 可 以 生 
成 大 量 指纹 。 


本 小 节 先 介绍 提取 设备 指纹 的 算法 ， 在 下 一 小 节 中 介绍 提取 随机 数 的 算法 。 


Wang 等 人 提出 的 提取 设备 指纹 的 算法 是 基于 “部 分 编程 ” (partial programming) 方法 。 为 了 将 NAND Flash 的 存储 单元 处 于 介 于 “ 擦 除 状 


”和 “编程 状态 ”之 间 的 不 稳定 状态 ， 可 以 通过 对 NAND Flash 进 行 一 定 的 编程 与 擦 除 操作 ， 这 种 操作 被 称 为 “部 分 编程 ”操作 。 部 分 编程 方法 的 具体 做 法 


加 让 


1) 首先 擦 除 一 个 块 。 
2) 对 某 一 个 物理 页 进行 编程 操作 ， 写 为 全 0。 
3) 当 上 述 编程 操作 执行 “一 段 时 间 ” 后 ， 立 即 皮 送 “reset” 命 令 ， 使 得 编程 命令 停止 执行 。 


通过 上 述 做 法 融 能 使 得 目标 物理 页 中 的 存储 单元 处 于 一 种 “部 分 编程 ”状态 ， 通 过 多 次 测试 ， 读 该 物理 页 的 数据 ， 人 存储 单元 输出 的 结果 有 时 是 “1” 有 时 
0”， 因 此 可 以 用 来 生成 设备 指纹 。 


和 


上 述 部 分 编程 操作 过 程 中 提 到 的 “一 段 时 间 ”， 是 指 比 NAND Flash 芯 片 数据 手册 中 定义 的 平均 编程 时 间 (tPROG) 短 的 一 段 时 间 ， 一 般 是 芯片 定义 的 平 
均 编程 时 间 的 1/20 到 1/10。 一 般 的 SLC 与 MLC 类 型 NAND Flash 心 片 所 定义 的 平均 编程 时 间 是 200hs， 而 有 的 容量 较 大 的 MLC 类 型 NAND Flash 心 片 所 定义 的 
平均 编程 时 间 是 1200hs。 


Wang 等 人 提出 的 提取 设备 指纹 的 具体 算法 如 图 10-4 所 示 。 


Choose a partial programming time T (below 
the rated program time). 


Nbits number of bits in one page 
Order 1 ，; 
Initialize BitRank [Nbits] to 0. 


do { 


Partially program a page for TT; 
For all programmed bits do 
BitRank [programmed bit] = Order; 
End for 
Order = Order + 1; 
上 repeat until most (99%) bits in the page 
are programmed 





图 10-4 Wang 等 人 提出 的 提取 设备 指纹 算法 


下 面 对 图 10-4 中 的 算法 进行 解释 说 明 。 首 先 选 择 部 分 编程 所 持续 的 时 间 ， 即 比 所 用 NAND Flash 必 片 所 定义 的 平均 编程 时 间 少 的 一 段 时间 。Wang 等 人 选 
择 的 NAND Flash 蕊 片 的 平均 编程 时 间 是 200hs， 而 部 分 编程 所 持续 的 时 间 “T” 选择 为 29.3hs。 然 后 将 一 个 块 擦 除 ， 选 择 其 中 的 一 页 进行 部 分 编程 操作 。 每 次 
进行 部 分 编程 操作 之 后 ， 读 此 页 中 的 数据 ， 判 断 每 一 个 仓储 单元 是 否 被 编程 ， 即 由 逻辑 状态 “1” 变 为 “0”。 各 友 生 了 位 翻转 现象 ， 则 将 此 存储 单元 标记 为 此 
时 执行 的 部 分 编程 操作 数 。 一 直 循环 上 述 过程 ， 直 到 该 页 中 大 多 数 (99%) 存储 单元 已 被 编程 ， 并 将 没有 被 编程 的 存储 单元 标记 为 0。 最 终 将 所 有 存储 单元 被 
编程 时 所 执行 的 部 分 编程 数组 合 起 来 ， 组 成 了 从 该 页 中 提取 的 一 个 设备 指纹 的 源 数据 。 接 下 来 可 以 对 上 述 源 数据 再 进行 处 理 ， 比 如 将 源 数据 中 最 大 值 的 一 半 设 
为 门限 值 ， 大 于 这 个 门限 值 的 存储 单元 输出 “1” ， 而 小 于 这 个 门限 值 的 人 存储 单元 输出 “0”。 最 终 ， 将 这 组 “0/1” 位 串 作 为 从 该 页 中 提取 的 一 个 设备 指纹 。 


为 了 验证 所 提取 指纹 的 性 质 ，Wang 等 人 也 利用 了 相关 系数 来 判断 两 组 数字 指纹 信息 是 否 取 自 同 一 NAND Flash 芯 片 的 同一 块 和 页 。 定 义 X,Y) 为 一 组 
(A 
P(e 


数字 指纹 信息 对 ， 根 据 公 式 3 计算 其 相关 系数 。 根 据 计 算 的 相关 系数 大 小 ， 可 以 判断 两 组 数字 指纹 信息 是 人 否 取 上 自 同一 NAND Flashv 
片 的 同一 块 和 页 。 相 关系 数 越 趋 近 于 1， 说 明 两 种 指纹 越 相 近 ， 反 之 ， 相 天 系数 越 趋 近 于 0， 说 明 两 种 指纹 差别 越 大 。 


图 10-5 中 左 图 表示 从 同一 个 NAND Flash 的 同一 页 中 提取 的 两 组 指纹 ， 其 相关 系数 高 达 0.9793， 而 右 图 是 从 不 同心 片 中 提取 的 两 组 设备 指纹 ， 其 相关 系数 
仅 为 -0.0039。 
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图 10-5 ”指纹 相关 系数 
Wang 等 人 对 利用 部 分 编程 法 提取 的 设备 指纹 进行 了 以 下 性 能 测试 。 
(1) 唯一 性 


为 了 测试 所 提取 的 设备 指纹 的 唯一 性 ， 分 别 计 算 了 从 不 同 NAND Flash 心 请 提取 的 设备 指纹 之 间 的 相关 系数 ， 以 及 从 同一 NAND Flash 必 片 的 不 同位 置 提 
取 的 设备 指纹 之 间 的 相关 系数 。 


提取 的 66240 对 来 自 于 不 同 NAND Flash 心 片 提 取 的 设备 指纹 ， 其 相关 系数 仪 为 0.0076。 提 取 的 1656000 对 同一 NAND Flash 心 片 不 同位 置 提 取 的 设备 指 
纹 ， 其 相关 系数 仅 为 0.0072。 由 此 可 见 ， 设 备 指 纹 的 唯一 性 非常 好 。 


(2) 鲁 棒 性 


为 了 测试 所 提取 的 设备 指纹 的 唯一 性 ， 计 算 了 多 组 从 同一 NAND Flash 心 片 相同 位 置 提取 的 设备 指纹 之 间 的 相关 系数 ， 实 验 测 得 平均 相关 系数 为 0.9673,， 
而 最 新 的 相关 系数 也 为 0.9022。 为 了 在 认证 机 制 中 使 用 设备 指纹 ， 可 以 设置 一 个 相关 系数 的 门限 值 t。 当 测量 两 个 指纹 的 相关 系数 大 于 t 时 ， 则 认为 是 来 自 于 同 
一 个 NAND Flash 心 睛 的 同一 位 置 ， 否 则 残 不 是 来 自 于 同一 个 NAND Flash 心 片 。 


接 下 来 验证 了 在 设 定 固定 门限 值 t 的 情况 下 的 误 报 率 和 漏 报 率 。 误 报 率 就 是 将 来 自 不 同 NAND Flash 心 片 ， 或 者 相同 NAND Flash 心 片 不 同位 置 的 设备 指纹 
误 认 为 来 自 于 相同 NAND Flash 心 片 同一 位 置 。 相 反 ， 漏 报 率 就 是 将 来 自 于 相同 NAND Flash 必 片 同 一 位 置 的 设备 指纹 误 认 为 来 自 于 不 同 的 NAND Flash 位 


二 


是 。 


当 直接 把 从 一 页 中 提取 的 设备 指纹 (16384 位 ) 应 用 在 认证 机 制 中 时 ， 当 t=0.5 时 ， 测 得 误 报 率 和 漏 报 率 为 2.62x10-539， 当 t=0.7 时 ， 测 得 误 报 率 和 漏 报 
率 为 7.43x10-181。 如 此 小 的 误 报 率 和 漏 报 率 ， 使 得 我 们 不 必 采 用 从 一 整 页 中 提取 的 全 部 设备 指纹 。 


当 采 用 256 位 的 设备 指纹 、 门 限 值 t 设 为 0.3 时 ， 测 得 误 报 率 和 漏 报 率 为 7.91x 10-/。 而 采用 1024 位 的 设备 指纹 ， 同 样 将 门限 值 t 设 为 0.3 时 ， 测 得 误 报 率 和 漏 
报 率 为 3.20x10-<<。 由 此 可 见 ， 设 备 指纹 的 鲁 棒 性 也 非常 好 。 


(3) 温度 变化 及 使 用 寿命 


为 了 测试 在 不 同 温度 下 所 提取 设备 指纹 的 稳定 性 ， 比 较 了 分 别 在 两 种 比较 极端 的 温度 (60°C 以 及 -5°*C) 及 常温 25°C 情 况 下 ,提取 的 NAND Flash 心 片 设备 
指纹 的 相关 系数 变化 情况 。 


图 10-6 中 比较 了 从 同一 个 NAND Flash 心 片 ， 在 不 同 温度 下 提取 的 设备 指纹 的 相关 性 比较 。 从 图 中 可 以 看 出 ， 通 过 各 种 温度 的 对 比 ， 设 备 指纹 的 相关 性 都 
维持 在 较 高 水 平 。 在 60"C 以 及 -5°C 提 取 的 设备 指纹 平均 相关 性 也 在 0.9 以 上 ， 足 以 与 其 他 心 片 的 设备 指纹 区 分 开 。 所 以 ,温度 变化 对 NAND Flash 心 片 的 设备 
指纹 的 影响 较 小 。 


由 于 NAND Flash 芯 片 具有 一 定 的 擦 写 寿命 ， 图 10-7 中 比较 了 随 着 NAND Flash 芯 片 的 使 用 、 擦 除 /编程 (P/E) 次 数 ( 横 轴 代表 P/E 次 数 ) 的 增 
加 ，NAND Flash 芯 片 设备 指纹 的 相关 性 变化 。 从 图 中 可 以 看 出 ， 同 一 NAND Flash 芯 片 设 备 指纹 的 相关 性 确实 是 随 着 世 片 的 使 用 次 数 增加 而 减 小 ， 但 是 经 过 
50 万 次 擦 写 后 (一般 NAND Flash 必 片 的 探 写 寿命 是 10 万 次 ， 已 经 远 远 超出 一 个 心 片 的 擦 写 寿命 ) 的 设备 指纹 与 心 片 最 新 状态 时 的 设备 指纹 的 平均 相关 性 仍 在 
0.6 以 上 ， 这 也 足以 与 其 他 芯片 的 设备 指纹 区 分 开 来 。 所 以 ，NAND Flash 芯 片 的 擦 写 次 数 变化 对 其 设备 指纹 的 影响 也 较 小 。 
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图 10-6 ”不同 温 度 下 指纹 相关 系数 对 比 








擦 除 / 编 程 P/E》 次数 x105 


图 10-7 指纹 相关 性 随 着 PE 次 数 的 变化 


(4) 安全 性 


若 政 手 在 不 知道 设备 指纹 所 利用 的 NAND Flash 中 页 的 位 置信 息 的 情况 下 ， 试 图 伪造 一 个 NAND Flash 必 片 的 设备 指纹 ， 融 必须 将 心 片 中 每 一 个 页 的 设备 
指纹 都 提前 存储 好 。 每 一 个 设备 指纹 的 提取 平均 需要 800 次 部 分 编程 操作 ， 所 以 存储 一 个 存储 单元 (1 位 ) 的 指纹 至 少 需 要 10 位 ， 所 以 存储 一 个 NAND Flash 
片 的 所 有 指纹 至 少 需要 10 倍 于 此 忌 片 的 存储 容量 。 


提取 NAND Flash 芯 片 的 一 个 设备 指纹 需要 大 约 10s， 而 一 个 NAND Flash 芯 片 至 少 有 十 几 万 个 页 ， 所 以 敌手 重 放 攻 击 成 功 需要 两 周 时 间 。 


(5) 普 适 性 


Wang 等 人 的 实验 数据 主要 是 从 镁 光 (Micron) 的 SLC 类 型 NAND Flash 上 提取 的 ， 也 在 MLC 类 型 NAND Flash 上 验证 了 利用 部 分 编程 法 提取 设备 指纹 的 
效果 。 


通过 实验 验证 ， 利 用 部 分 编程 法 提取 设备 指纹 同样 适用 于 MLC 类 型 NAND Flash。 但 是 ， 有 的 MLC 类 型 NAND Flash 芯 片 ， 如 海 力士 (Hynix) 的 芯片 ， 
将 一 个 存储 单元 中 的 两 位 数据 分 为 快速 编程 区 和 慢 速 编程 多， 导致 两 位 数据 的 编程 速度 不 一 样 ， 所 以 在 提取 设备 指纹 时 ， 需 要 比较 来 自 于 同一 区 域 的 位 数据 。 


10.2.2 ”提取 随机 数 


随机 数 是 密码 系统 及 安全 协议 中 的 重要 组 成 部 分 ， 人 在 很 多 通信 系统 也 利用 随机 数 生成 密 铀 ， 并 要 求生 成 的 随机 数 可 以 抵抗 重 放 攻击 。 然 而 ， 目 前 在 很 多 系 
统 中 ， 都 是 利用 伪 随 机 数 发 生 器 (pseudo-random number generator) 来 生成 随机 数 ， 如 果 发 生 器 的 种 子 被 重复 利用 或 者 是 可 预测 的 ， 伪 随机 数 发 生 器 就 
不 能 产生 真正 安全 的 随机 数 了 。 例 如 ， 最 近 的 一 项 研究 上 必 现 ， 重 复 利用 虚拟 机 的 镜像 来 产生 的 随机 数 是 可 预测 的 ， 并 且 由 此 可 用 来 破解 传输 层 安全 

(Transport Layer Security，TLS) 。 所 以 ， 基 于 随机 数 的 重要 性 ， 很 多 高 安全 系统 都 利用 硬件 来 产生 随机 数 。 


Wang 等 人 发 现 NAND Flash 疙 片 的 存储 单元 中 存在 两 种 噪声 ， 即 随机 电子 噪声 (Random Telegraph Noise，RTN) 和 热 噪 声 (thermal noise) 。 


随机 电子 噪声 存在 于 尺寸 非常 小 的 电子 设备 中 ， 比 如 NAND Flash 和 存储 单元 的 晶体 管 中 。 由 于 交替 的 捕获 和 释放 载 流 子 ， 导 致 在 NAND Flash 和 存储 单元 靠 
近 衬 底 附 近 的 隧道 氧化 层 中 产生 离散 的 电流 变化 。NAND Flash 存 储 单元 中 随机 电子 噪声 有 以 下 特点 : 


1) 捕获 和 释放 载 流 子 的 时 间 是 随机 的 ， 并 且 呈 现 指 数 分 布 。 

2) 随机 电子 噪声 可 利用 功率 谱 密度 与 其 他 噪声 区 分 开 来 ， 随 机 电子 噪声 在 低频 呈现 平滑 ， 而 在 高 频 幅 度 是 1/ (f*) ， 伸 采样 频率 
3) 随机 电子 噪声 的 振幅 与 栅 极 的 面积 成 反比 ， 栅 极 面 积 越 小 ， 其 振幅 越 大 。 

4) 随机 电子 噪声 的 振幅 与 温度 几乎 无 天 。 


5) 随 着 NAND Flash 存 储 单元 面积 的 减 小 ， 随 机 电子 噪声 对 存储 单元 的 国 值 电压 的 影响 融 越 大 。 


NAND Flash 存 储 单元 中 还 存在 一 种 噪声 ， 即 热 噪 声 。 热 噪声 是 一 种 日 噪声 ， 广 泛 地 存在 于 很 多 电子 设备 中 。 热 噪声 的 幅度 与 温度 有 关 ， 在 低温 中 会 明显 
减 小 。 在 一 定 温度 下 ， 由 于 热 噪声 是 均匀 分 布 的 ， 所 以 不 必 考 虑 去 除 热 噪 声 。 


由 于 随机 电子 噪声 已 经 是 影响 NAND Flash 稳 定性 的 主要 因素 ,很 多 文章 已 经 从 可 靠 性 的 角度 研究 了 NAND Flash 存 储 单元 中 的 随机 电子 噪声 现象 。 然 
而 ，Wang 等 人 提出 随机 电子 噪声 作为 一 种 量子 噪声 ， 不 随 温度 变化 而 变化 ， 具 有 很 好 的 随机 性 ， 因 此 可 以 用 来 生成 随机 数 ， 而 不 需要 增加 其 他 硬件 模块 。 量 
子 噪声 的 不 确定 性 保证 利用 随机 电子 噪声 产生 的 随机 数 的 粒 的 可 靠 性 ， 是 设计 随机 数 上 友 送 器 的 “黄金 标准 ”。 他 们 通过 设计 算法 自动 选 择 具 有 随机 电子 噪声 行 
为 的 存储 单元 ， 并 且 将 随机 电子 噪声 转化 为 随机 数 ， 通 过 NAND Flash 的 标准 接口 输出 。 


1. 提 取 噪 声 

为 了 观测 到 可 用 于 生成 随机 数 的 噪声 ， 提 取 随 机 噪声 所 造成 的 随机 数 ， 需 要 满足 以 下 条 件 : 
1) NAND Flash 存 储 单元 中 靠近 衬 底 的 隧道 氧化 层 存 在 电势 陷阱 。 

2) 随机 噪声 的 幅度 大 于 热 噪 声 的 幅度 。 

3) 采样 频率 (连续 读数 据 的 操作 ) 足够 高 。 


只 有 同时 满足 以 上 三 个 条 件 ， 才 能 提取 到 随机 电子 噪声 现象 ， 否 则 只 能 提取 到 热 噪声 现象 。 当 随机 电子 噪声 的 幅度 明显 大 于 热 噪声 时 ， 只 有 随机 电子 噪声 
才能 被 观测 到 ， 图 10-8 表 示 的 是 从 NAND Flash 中 进行 读 取 操作 所 采集 的 数据 ， 可 以 看 出 由 于 受到 随机 电子 噪声 的 影响 ， 在 时 间 域 中 呈现 “0″ 和 “1” 交 蔡 出 
现 的 情况 。 而 且 ， 所 提取 数据 串 的 功率 谱 密度 的 幅度 是 1/ (f2) ， 其 中 人 是 采样 频率 。 





27.32 27.33 27.34 27.35 27.36 27.37 


Ha]/s 


图 10-8 ”随机 电子 噪声 对 读 操 作 的 影响 





虽然 随机 电子 噪声 与 热 噪声 都 能 用 于 生成 随机 数 ， 但 是 随机 电子 噪声 受 温度 的 影响 小 ， 所 以 Wang 等 人 主要 利用 了 随机 电子 噪声 来 产生 随机 数 。 
2. 随 机 数 提 取 算 法 


在 NAND Flash 存 储 单 元 中 ， 随 机 电子 噪声 体现 为 “ 擦 除 状态 ” (一 连 串 “1”) 和 “编程 状态 ” (一 连 串 “0”) 的 交替 出 现 。 通 过 对 NAND Flash 进 行 
一 定 的 擦 除 、 编 程 操 作 ， 基 于 NAND Flash 的 随机 数 友 生 器 可 以 识别 出 随机 电子 噪声 现象 造成 的 数据 变化 。 


定义 处 于 “编程 状态 ”的 时 间 ， 即 一 个 单元 处 在 状态 “0” 时 的 一 段 连 续 时 间 ， 为 down-time。 定 义 处 于 “ 探 除 状态 ”的 时 间 ， 即 一 个 单元 处 在 状 
人 态 “1” 时 的 一 段 连 续 时 | 间 ， 为 up-time。 为 了 将 随机 电子 噪声 造成 的 数据 状态 变化 转化 为 二 进 制 数 ， 利 用 冯 : 诺 依 曼 提 取 法 将 down-time 和 up-time 转 化 为 二 
进 制 位 串 ， 作 为 随机 数 的 最 后 结果 。 冯 : 诺 依 曼 提 取 法 即 输入 不 等 概率 的 “0” 和 “1”， 当 输入 “00” 或 “11” 时 忽略 ， 当 输入 “10” 时 输出 “1”， 输 
入 “01” 时 输出 “0”。 冯 : 诺 依 曼 提 取 法 可 以 保证 只 要 每 次 输入 没有 相关 性 ， 束 可 以 达到 均等 输出 。 图 10-9 中 的 伪 代 码 表示 的 是 提取 随机 数 的 过 程 。 


Erase a plock.; 


do 1 
Partially program a page for T; 
NUm 二 + ; 


Read Nbytes in a page N times, and record a 
trace for each bit — trace [bitl].: 
For each pit in Nbytes, not selected vyet 
If (CheckRTIN (trace [bit|]) == true) { 
Selected[bit] = yes:; 
NumPprogramlbit|] = Num; 
| 
End for 
|} repeat until most bits are programmed. 


ProgramSelectBits (Selected),; 


Read selected bits M times, and record up- 
time and down-time,; 
For each bit 
ConvertToBinary (rawdata):; 
End for 


图 10-9 ”随机 数 提 取 算 法 


下 面 对 图 10-9 中 的 算法 进行 解释 说 明 。 首 先 擦 除 一 个 块 ， 然 后 对 此 块 中 的 一 页 进行 多 次 部 分 编程 操作 ， 每 次 持续 时 间 为 T。 每 次 部 分 编程 操作 之 后 ， 对 此 
页 中 的 N 字 节 (比如 前 10 字 节 ， 即 前 80 个 存储 单元 ) 进行 N 次 (比如 1000 次 ) 读 操 作 ， 并 将 每 一 个 存储 单元 的 读 操作 结果 组 成 一 个 数组 trace[bitJ]。 判 断 每 个 
存储 单元 这 N 次 读 操 作 的 结果 中 是 否 存 在 随机 电子 噪声 的 影响 (判断 依据 稍 后 解释 ) 。 如 果 检 测 到 某 个 存储 单元 受到 了 随机 电子 噪声 的 影响 ， 则 将 此 存储 单元 
标记 出 来 ， 而 不 用 执行 再 次 验证 ， 并 记录 此 时 部 分 编程 的 次 数 。 这 个 过 程 一 直 循 环 进行 ， 直 到 所 检测 的 存储 单元 大 多 数 都 被 检测 到 了 随机 电子 噪声 的 影响 。 

再 次 擦 除 此 块 ， 对 已 经 检测 到 受 随机 电子 噪声 影响 的 存储 单元 ， 再 次 进行 部 分 编程 和 多 次 读 操 作 ， 直 到 被 标记 的 每 个 人 存储 单元 都 可 以 观测 到 受 随 机 电子 噪 
声 的 影响 。 

最 后 读 取 所 标记 的 各 个 存储 单元 的 数据 M 次 ， 并 记录 每 个 存储 单元 的 down-time 和 up-time， 并 用 冯 . 诺 依 曼 提 取 法 将 down-time 和 up-time 转 化 为 二 进 
制 位 串 ， 作 为 最 后 随机 数 的 输出 结果 。 

解释 一 下 根据 一 个 存储 单元 的 N 次 (如 1000 次 ) 读 操 作 的 结果 ， 判 断 是 人 否 人 存在 随机 电子 噪声 的 影响 的 过 程 。 首 先 ， 排 除 读 操 作 结 果 中 有 989% 以 上 是 
全 “1” 或 者 全 “0” 的 存储 单元 ， 因 为 这 些 存 储 单元 显然 没有 受到 随机 电子 噪声 的 影响 。 由 于 随机 电子 噪声 的 功率 谱 密 度 在 高 频 时 (大 于 200Hz) 的 幅度 有 
1/ (ft) 的 特点 ， 其 中 人 是 采样 频率 ， 可 以 用 来 区 分 随机 电子 噪声 与 热 噪声 。 所 以 ， 接 下 来 计算 其 他 存储 单元 读 操作 结果 的 功率 谱 密度 。 若 根据 某 个 存储 单元 的 
读 操作 结果 所 计算 的 功率 谱 密 度 ， 在 高 频 时 的 斜率 小 于 -1.5， 则 认为 此 存储 单元 只 受到 了 随机 电子 噪声 的 影响 ; 若 在 高 频 时 人 至少 有 一 点 的 斜率 小 于 -1.5， 则 认 


为 此 存储 单元 同时 受到 了 随机 电子 噪声 与 热 噪 声 的 影响 。 


3. 实 验 


Wang 等 人 利用 图 10-10 的 NAND Flash 测 试 开 发 板 进行 了 实验 验证 ， 可 以 看 出 这 是 普通 的 PCB 开 上 友 板 ， 上 面 有 一 个 插座 ， 可 以 安装 待 测试 的 NAND Flash 
心 片 。 开 上 友 板 上 的 可 编程 的 ARM 微 控制 器 可 以 向 NAND Flash 心 片 友 送 命令 ， 并 接收 心 片 返回 的 数据 ， 数 据 可 通过 串口 输出 。 这 个 开发 平台 也 说 明基 于 
NFPUF 提 取 随 机 数 的 方案 可 以 适用 于 现 有 的 基于 NAND Flash 的 存储 设备 ， 而 不 需要 增加 额外 的 电路 。 
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图 10-10 NAND Flash 测 试 开发 板 
Wang 等 人 测试 了 表 10-1 中 的 NAND Flash 心 片 ， 即 从 3 个 不 同 厂 家 生产 的 4 种 不 同类 型 的 NAND Flash 心 片 ， 并 涵盖 了 SLC 和 MLC 类 型 。 


表 10-1 测试 的 NAND Flash 世 片 


Numonyx NAND04GW3B2DN6 Snm SLC 


Men MT29F2G08ABAEAWP-IT:E 4 24 3 SHG 


了 二 MT29F16G08CBACAWP:C 16Gbit MLC 


在 随机 性 方面 ，Wang 等 人 将 生成 的 随机 数 通 过 NI1ST 测 试 套件 检测 ， 成 功 地 通过 了 所 有 测试 。 





在 速度 方面 ， 在 上 述 开 友 平 台 下 ，Wang 等 人 测 得 随机 数 的 提取 速度 在 848bit/s~3.27Kbit/s， 每 秒 可 产生 1Kb 到 10Kb 随 机 数 。 


在 抵抗 温度 变化 的 测试 中 ， 利 用 随机 噪声 提取 随机 数 的 方法 在 低温 (-80"C) 时 仍然 肥效。 事实 上 ， 随 机 电子 噪声 现象 在 低温 下 反而 会 更 加 明显 。 由 于 降 
低温 度 ， 热 噪声 减 小 ， 提 取 速 度 虽 略 有 降低 ， 但 提取 的 数据 仍 能 全 部 通过 NI1ST 测 试 。 


在 使 用 寿命 方面 ， 随 着 NAND Flash 的 使 用 ， 受 随机 电子 噪声 影响 的 存储 单元 会 增加 ， 因 此 会 获得 更 多 的 随机 数 ， 且 都 能 通过 随机 数 检测 。 


10.2.3 ”信息 隐藏 


Wang 等 人 提出 了 利用 NAND Flash 进 行 信 息 隐 藏 的 方案 ， 隐 藏 的 信息 并 不 是 直接 人 存 储 在 NAND Flash 的 存储 单元 中 ， 而 是 利用 存储 单元 的 物理 特性 ， 即 
每 个 仓储 单元 的 编程 时 间 的 差异 性 来 进行 信息 隐藏 。 


1. 信 息 隐 藏 原理 


在 对 NAND Flash 心 片 的 存储 单元 进行 探 除 和 编程 操作 时 ， 需 要 在 人 存储 单元 对 应 的 位 续 或 字 线 上 施加 高 电压 ， 这 会 导致 存储 单元 的 隧道 氧化 层 上 产生 强 电 
势 ， 随 着 芯片 的 使 用 、 擦 写 次 数 的 增加 ， 隧 道 氧 化 层 会 受到 损害 。 当 对 一 个 NAND Flash 芯 片 中 的 某 些 存储 单元 进行 了 大 量 的 擦 写 操作 ， 这 些 存 储 单元 的 隧道 
氧化 层 受到 了 足够 大 的 损耗 ， 融 会 导致 这 些 人 存储 单元 变 得 不 可 靠 ， 即 不 能 正音 进行 擦 除 、 编 程 操作 了 ， 所 以 NAND Flash 心 片 是 有 一 定 寿命 的 ， 即 NAND 
Flash 心 片 只 能 在 一 定 的 探 写 次 数 之 前 保证 存储 数据 的 可 靠 性 。 


在 NAND Flash 心 请 的 正常 使 用 过 程 中 ， 随 着 擦 写 次 数 的 增加 ， 和 存储 单元 的 物理 性 质 也 会 被 慢 慢 改变 。 和 存储 单元 的 编程 时 间 ， 即 在 编程 操作 时 由 逻辑 状 
态 “1” 变 成 逻辑 状态 “0” 的 时 间 ， 会 随 着 擦 写 次 数 的 增加 而 减 小 。 由 于 NAND Flash 心 片 在 制造 过 程 形成 的 差异 性 ， 每 一 个 存储 单元 所 需要 的 编程 时 间 是 不 
一 样 的 。 


Wang 等 人 正 是 利用 每 个 存储 单元 编程 时 间 的 差异 性 来 进行 信息 隐藏 。 由 于 NAND Flash 芯 片 编程 操作 的 最 小 单位 是 页 ， 即 一 个 页 中 所 有 的 存储 单元 同时 
被 编程 。 通 常 ， 在 NAND Flash 心 片 一 个 页 中 进行 正常 的 编程 操作 所 需要 的 时 间 ， 即 NAND Flash 心 片 数 据 手 册 中 的 tprog 参 数 ， 是 指 保证 该 页 中 所 有 存储 单元 
都 被 成 功 编程 的 最 短 时 间 ， 而 不 是 单个 仓储 单元 所 需要 的 编程 时 间 。 


为 了 测 得 每 一 个 存储 单元 所 需要 的 编程 时 间 ，Wang 等 人 也 利用 了 部 分 编程 的 方法 。 即 对 一 个 已 被 探 除 过 的 物理 页 进行 编程 操作 ， 写 为 全 0， 当 编程 操作 
执行 “一 段 时 间 ” 后 ， 立 即 友 送 “reset” 命 令 ， 使 得 编程 命令 停止 执行 。 部 分 编程 操作 会 导致 目标 页 中 的 存储 单元 处 于 一 种 不 稳定 的 状态 ， 即 有 的 存储 单元 
会 变 为 逻辑 状态 “0”， 而 有 些 仓 储 单元 仍然 处 于 逻辑 状态 “1”。 通 过 多 次 的 部 分 编程 操作 ， 随 着 存储 单元 中 浮 置 栅 极 上 电 倚 的 积累 ， 最 终 该 页 中 的 所 有 存储 
单元 都 会 进入 稳定 的 “编程 状态 ”。 将 一 个 存储 单元 从 “ 擦 除 状 态 ”， 即 逻辑 状态 “1”， 变 成 “编程 状态 ”， 即 逻辑 状态 “0” 所 需要 的 “部 分 编程 次 数 ” 称 
为 这 个 存储 单元 所 需要 的 编程 时 间 |。 


为 了 能 够 利用 每 个 仓储 单元 的 “编程 时 间 ” 的 差异 性 来 进行 信息 隐藏 ， 融 需要 能 够 控制 每 一 个 存储 单元 所 需要 的 编程 时 间 。 已 有 工作 指出 : 随 着 NAND 
Flash 心 片 的 探 写 次 数 的 增加 ， 存 储 单元 所 需要 的 编程 时 间 是 逐渐 减少 的 。 


Wang 等 人 在 实验 中 友 现 ， 昌 然 NAND Flash 心 片 编程 操作 的 最 小 单位 是 页 ， 但 是 可 以 通过 控制 向 一 页 中 写 的 数据 ， 来 改变 一 页 中 各 个 存储 单元 所 受到 的 
损害 。 具 体 地 讲 ， 在 一 个 块 中 执行 擦 除 操作 后 ， 该 块 中 所 有 页 的 存储 单元 都 被 强制 变 成 了 逻辑 状态 “1”， 在 一 个 已 经 擦 除 的 页 中 进行 编程 操作 时 ， 只 有 被 写 
为 逻辑 状态 “0 ”的 存储 单元 会 承受 较 大 的 编程 损耗 ， 而 被 写 为 逻辑 状态 “1” 的 存储 单元 ， 由 于 逻辑 状态 没有 改变 ， 所 以 承受 编程 损耗 较 小 。 当 此 页 所 在 的 块 
再 次 被 探 除 后 ， 被 写 入 “1” 的 存储 单元 在 这 个 编程 、 探 除 过 程 中 没有 上 友 生 逻辑 状态 的 变化 ， 而 被 写 入 “0 ”的 仓储 单元 经 历 了 一 次 完整 的 编程 、 探 除 周 期 ， 从 
而 承受 了 更 大 的 编程 、 擦 除 损耗 。 


因此 ， 可 以 通过 控制 向 一 页 中 写 入 的 数据 ， 即 向 一 个 存储 单元 中 写 入 “0” 还 是 写 入 “1”， 来 控制 特定 的 存储 单元 所 承受 的 损耗 ， 从 而 影响 存储 单元 的 隧 
道 氧 化 层 的 物理 性 质 ， 导 致 存储 单元 所 需要 的 编程 时 间 变 化 ， 最 终 导 致 仓储 单元 所 需要 的 部 分 编程 操作 次 数 产 生变 化 。 


实际 上 ， 由 于 在 NAND Flash 必 有 片 生产 过 程 中 造成 各 个 存储 单元 具有 较 大 的 差异 性 ， 而 且 这 种 差异 性 要 比 上 述 特定 的 编程 、 探 除 操作 所 造成 的 对 存储 单元 
编程 时 间 的 影响 大 得 多 。 也 融 是 说 ， 即 使 对 一 个 编程 时 间 较 长 的 存储 单元 进行 大 量 特殊 的 编程 、 探 除 操作 ， 也 不 会 明显 减 小 其 与 原来 残 需要 编程 时 间 较 短 的 存 
储 单元 之 间 的 差距 。 


基于 上 述 情况 ，Wang 等 人 提出 采用 多 个 存储 单元 来 隐藏 1 位 信息 的 方案 。 对 每 一 位 要 隐藏 的 数据 ， 选 择 一 组 NAND Flash 和 存储 单元 ， 将 这 一 组 存储 单元 编 
呈 到 同一 逻辑 状态 ， 即 “1” 或 者 是 “0”。 一 组 存储 单元 的 平均 编程 时 间 有 效 地 减少 了 不 同人 存储 单元 编程 时 间 的 差异 性 ， 这 样 可 以 使 得 隐藏 的 信息 更 可 靠 地 恢 


复 。 


Wang 等 人 还 提出 利用 一 个 隐藏 密 钥 来 确定 每 一 位 要 隐藏 的 数据 所 要 选择 一 组 NAND Flash 存 储 单元 的 位 置 ， 这 样 的 话 ， 如 果 敌 手 不 知道 这 个 密 铜 ， 就 不 
能 确定 哪些 存储 单元 被 分 在 一 组 来 隐藏 数据 ， 由 此 增加 信息 隐藏 机 制 的 安全 性 。 


Wang 等 人 随机 选择 了 5120 组 存储 单元 ， 每 组 存储 单元 包含 来 自 于 同一 页 中 的 128 个 存储 单元 ， 用 每 组 存储 单元 的 平均 编程 时 间 来 隐藏 1 位 信息 ， 
即 “1” 或 者 “0”。 图 10-11 说 明了 当 所 选用 的 存储 单元 被 正确 分 组 后 每 组 存储 单元 的 平均 编程 时 间 分 布 图 ， 横 坐标 代表 归 一 化 的 平均 部 分 编程 次 数 ， 纵 坐标 
代表 组 数 。 通 过 图 10-11 我 们 可 以 看 出 ， 编 程 时 间 较 长 的 分 组 与 编程 时 间 较 短 的 分 组 之 间 有 着 明显 的 界限 ， 所 以 可 以 通过 设 定 阅 值 的 方法 来 进行 区 分 。 当 阅 值 
设 为 0.77 时 ， 各 分 组 恢复 数据 的 错误 率 (BER) 仪 为 0.0029， 即 可 以 有 99.71% 的 把 握 将 每 个 分 组 所 隐藏 的 位 信息 进行 可 靠 的 恢复 。 


图 10-12 表 示 的 是 当 所 选用 的 存储 单元 没有 被 正确 分 组 时 ， 每 组 存储 单元 的 平均 编程 时 间 分 布 图 。 通 过 图 10-12 中 我 们 可 以 看 出 ， 各 组 的 平均 编程 时 间 之 
间 没 有 明显 的 界限 ， 而 是 呈现 规则 的 正 态 分 布 。 当 靖 值 设 为 0.77 时 ， 各 分 组 恢复 数据 的 错误 率 为 48.83%， 接 近 50%。 所 以 ， 如 果 收 手 不 知道 仓储 单元 的 分 组 
密 钥 惑 无 法 恢复 隐藏 的 信息 ， 因 为 每 一 组 人 存储 单元 中 都 均匀 分 布 着 编程 时 间 较 长 的 与 编程 时 间 较 短 的 人 存储 单元 。 
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图 10-11 正确 分 组 后 存储 单元 的 平均 编程 时 间 分 布 
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图 10-12 ”未 正确 分 组 后 存储 单元 的 平均 编程 时 间 分 布 


2. 信 息 隐 藏 方案 

在 将 要 隐藏 的 目标 数据 “ 写 入 ”NAND Flash 之 前 ， 第 一 步 需 要 先 将 目标 数据 分 配 到 选择 的 各 组 NAND Flash 存 储 单元 中 。 

(1) 隐藏 信息 

图 10-13 中 的 算法 摘 述 的 是 根据 隐藏 密 铀 和 目标 隐藏 数据 的 大 小 ， 选 择 NAND Flash 的 块 和 页 ， 每 一 组 存储 单元 只 用 来 隐藏 一 位 数据 。 


首 移 利用 RC4 沅 密码 算法 生成 隐藏 密 钥 ， 并 根据 隐藏 密 钥 选 择 隐藏 数据 中 每 一 位 的 隐藏 位 置 ， 即 定位 具体 到 NAND Flash 的 块 和 页 。 为 了 避免 在 编程 过 程 
中 相 邻 页 的 影响 ， 可 以 选择 不 相 邻 的 页 ， 比 如 选择 每 一 个 NAND Flash 块 中 的 第 0、4、8 页 等 ， 而 选中 的 页 也 只 使 用 部 分 存储 单元 即 可 。 


将 选中 的 每 一 页 中 选中 的 存储 单元 分 为 固定 大 小 分 组 ， 分 组 用 来 隐藏 1 位 数据 。 比 如 可 选择 160 个 NAND Flash 页 ， 使 用 每 一 页 的 前 4096 个 存储 单元 ， 并 


将 其 分 成 32 组 ， 每 组 128 个 存储 单元 ， 共 32x160=5120 个 组 ， 这 样 束 可 以 隐藏 5120 位 的 数据 。 


分 配 每 一 组 要 隐藏 的 数据 ， 即 分 配 隐藏 “1” 还 是 。 对 要 隐藏 数据 “1” 的 分 组 中 的 存储 单元 编程 为 “0” ( 即 写 入 0) ， 使 得 这 些 仓储 单元 经 历 一 次 
完整 的 编程 / 擦 除 周期 (P/E cycle) ; 对 要 隐藏 数据 “0” 的 分 组 中 的 仓储 单元 编程 为 “1” ( 即 写 入 “1”) ， 使 得 这 些 存 储 单元 经 历 不 完整 的 编程 / 擦 除 周 
期 ， 从 而 遭受 较 少 的 损害 


Part A -信息 组 成 
1 For each selected page in a block 
”Generate the group for each message bit via the page hiding key 
Assien each eroup 0 or 1 accordine to the embedded data 
For each bit 
lf its group Will represent a message 1] 
Set it to be programmed 0 
Else 
Set it to be programmed ] 
End 证 


10 上 nd for 
11 End for 


Part B -将 信息 写 入 Flash 

| For each selected block 

2 Forit = 1,2,..,N (N is the number of Hiding PE cycles) 
3 Erase the block 

加 Program every selected page 
5 End for 
6 End for 





图 10-13 ”隐藏 信息 算法 


接 下 来 根据 分 配 好 的 存储 单元 中 写 入 的 目标 数据 ， 对 选中 的 NAND Flash 块 和 页 进行 N 次 擦 除 /编程 操作 。 对 于 SLC 类 型 NAND Flash 来 说 ， 可 以 进行 几 百 
至 几 干 次 擦 除 / 编 程 操作 ， 而 对 于 MLC 类 型 NAND Flash 来 说 ， 需 要 的 控 除 /编程 操作 相对 较 少 。 这 样 就 可 以 有 效 地 改变 每 一 个 存储 单元 组 的 平均 编程 时 间 ， 即 
每 个 人 存储 单元 所 需要 的 平均 部 分 编程 次 数 。 
(2) 恢复 信息 


接 下 来 ， 残 需要 从 已 经 “ 写 入 ”隐藏 数据 的 NAND Flash 人 存储 单元 中 恢复 信息 了 。 图 10-14 中 的 算法 摘 述 了 恢复 隐藏 信息 的 第 一 步 ， 即 提取 每 一 个 目标 存 
储 单 元 的 部 分 编程 次 数 。 


Part h - 从 Filash 中 读 取 编程 时 间 
1 For each selected block 

Erase the block 

Program every bit in the block to 0 

Erase the block 

For each selected page 

For i = 1,2,...,M 
Partial program the page to 0 (abort a program operation after time 了 ) 

. For each bit in the page 
10 If the bit changed from 1 to 0 
1 Set programtime for this bit to i 
12 End if 
13 End for 
14 End for 
ls For each bit 
16 If the bit did not flip 
17 Set its programtime tobe M+]1 
18 End if 
19 End for 
20 End for 
21 Erase the block 
22 End for 





图 10-14 ”提取 每 个 目标 存储 单元 的 部 分 编程 次 数 


根据 隐藏 密 钥 定位 到 所 使 用 的 NAND Flash 块 和 页 ， 并 具体 到 每 一 个 分 区 所 使 用 的 存储 单元 。 对 于 每 一 个 使 用 的 NAND Flash 块 ， 首 先进 行 擦 除 操作 ， 然 
后 在 目标 页 中 进行 M 次 部 分 编程 操作 (每 次 编程 操作 持续 时 间 T 后 ， 取 消 编程 操作 ) ，M 一 般 取 30 左 右 。 每 一 次 部 分 编程 操作 完成 之 后 ， 读 取 目 标 页 中 的 数 
据 ， 观 察 所 有 的 目标 存储 单元 是 否 友 生 了 位 翻转 现象 。 若 有 的 存储 单元 友 生 了 位 翻转 现象 ， 则 记录 其 所 对 应 的 部 分 编程 次 数 。 在 执行 完 M 次 部 分 编程 操作 之 
后 ， 若 仍 存 在 没有 发 生 位 翻转 的 存储 单元 ， 则 标记 其 部 分 编程 次 数 为 M+1。 

获得 了 目标 存储 单元 的 部 分 编程 次 数 后 ， 融 可 以 从 中 恢复 隐藏 的 信息 了 。 如 图 10-15 中 的 算法 所 示 ， 首 先 找到 每 一 页 中 目标 存储 单元 的 部 分 编程 次 数 的 中 
位 数 X。 然 后 对 每 一 个 存储 单元 进行 判断 ， 若 部 分 编程 次 数 大 于 X/2， 则 将 该 存储 的 部 分 编程 次 数 标 记 为 1， 若 部 分 编程 次 数 小 于 X/2， 则 将 该 存储 的 部 分 编程 
次 数 标记 为 0。 


Part B — Extractine the payload message 
| For each selected block 
For each selected page 
Calculate the median X of the program times for all the blts 
For each bit 
If its programtime > (X/2) 
Set programtime to ] 
Else 
Set programtime to 0 
End 下 
End for 
Generate the group tor each message bit with the page hiding key 
For each group 
Calculate the average program time for the group 
[If the average 1s less than T°'h 
Recover the message bit: 1 
Else 
Recover the message bit: 0 
End 二 
End for 
JU End for 
21 End for 





接 下 来 根据 隐藏 密 钥 对 所 有 目标 存储 单元 进行 分 组 ， 计 算 每 一 组 中 所 有 存储 单元 部 分 编程 次 数 (被 标记 为 0 或 1 的 部 分 编程 次 数 ) 的 平均 数 。 为 了 区 分 每 一 
组 存储 单元 部 分 编程 数目 的 大 小 ， 恢 复出 隐藏 的 数据 是 “1” 还 是 “0”， 需 要 设 定 一 个 阅 值 。 计 算 羡 值 的 方法 是 对 每 一 组 存储 单元 的 平均 部 分 编程 次 数 进行 排 
序 ， 并 计算 排序 后 各 组 相 邻 存储 单元 的 最 大 间隔 ， 其 中 较 大 值 设 为 XM， 较 小 值 设 为 XL， 则 阐 值 Th 设 为 (XM+XL) /2。 

最 后 用 每 一 组 存储 单元 的 平均 部 分 编程 次 数 与 靖 值 Th 进行 比较 。 知 小 于 国 值 ， 则 该 组 存储 单元 所 隐藏 的 数据 为 “1”; 各 大 于 国 值 ， 则 该 组 存储 单元 所 隐 
这 是 因为 ， 在 进行 信息 隐藏 时 ， 对 要 隐藏 “1” 的 分 组 进行 了 多 次 写 “0”、 擦 除 操 作 ， 从 而 使 其 中 的 存储 单元 经 历 完整 的 擦 除 / 编 程 周期 ， 


藏 的 数据 为 “0”.。 
“1”、 探 除 操作 ， 从 而 使 其 中 的 人 存储 单元 只 进行 了 不 完整 的 擦 除 / 编 程 周 


导致 分 组 中 存储 单元 的 部 分 编程 次 数 减少 ;而 对 要 隐藏 “0” 的 分 组 进行 了 多 次 写 
期 ， 导 致 分 组 中 存储 单元 的 部 分 编程 次 数 偏 大 。 

3. 实 验 

与 提取 随机 数 的 方案 一 样 ，Wang 等 人 利用 图 10-10 的 NAND Flash 测 试 开 帮 板 进行 了 实验 验证 ， 这 个 开发 平台 也 说 明基 于 部 分 编程 的 信息 隐藏 方案 可 以 
适用 于 现 有 的 基于 NAND Flash 的 存储 设备 ， 而 不 需要 增加 额外 的 电路 或 其 他 硬件 。 

Wang 等 人 测试 了 表 10-2 中 的 NAND Flash 心 片 ， 由 3 个 不 同 厂 家 生产 的 5 种 不 同类 型 的 NAND Flash 心 片 ， 并 涵盖 了 SLC 和 和 MLC 类 型 。Wang 等 人 主要 是 
在 Micron 的 4Gbit 上 进行 实验 验证 的 ， 由 于 开发 板 上 控制 器 的 内 存 有 限 ， 在 实验 过 程 中 主要 使 用 了 每 一 NAND Flash 页 (2KB) 中 的 前 4096 位 ， 以 此 减 小 系统 
开销 。 

表 10-2 ”测试 的 NAND Flash 芯 片 


Hynix HY27UF084G2B 4Gbit SLC 


| MT29F4G08ABA 4 Gbit 15 34nm 
Micron 4Gbit 34nm SLC 
DAWP: D 


Mored MT29F2G08ABAEAWP-ITE 4 SA ST 
Neron MT29F16G08CBACAWP:C 16Gbit MLC 
Numonyx NAND04GW3B2DN6 s7nm SLC 


(1) 鲁 棒 性 





为 了 验证 依靠 存储 单元 编程 时 间 差 异性 来 进行 信息 隐藏 和 恢复 的 可 靠 性 ，Wang 等 人 向 NAND Flash 中 隐藏 了 一 段 随机 产生 的 信息 ， 并 检测 恢复 出 信息 的 
位 错误 率 (Bit Error Rate，BER) 。 


将 每 一 页 中 使 用 的 4096 个 存储 单元 分 成 32 组 ， 每 组 128 个 仓储 单元 。 基 于 隐藏 密 钥 从 整个 NAND Flash 必 片 中 选择 ?120 个 分 组 ， 来 隐藏 5120 位 的 数据 ， 
在 隐藏 信息 过 程 中 对 选中 的 NAND Flash 块 和 页 进行 5000 次 (N=5000) 探 除 /编程 操作 ， 然 后 再 对 数据 进行 恢复 ， 得 到 的 位 错误 率 为 0.29%， 也 惑 是 癌 在 隐藏 
的 5120 位 数据 中 ， 有 14.8 个 发 生 了 错误 。 


可 以 通过 以 下 方法 来 减 小 位 错误 率 。 第 一 个 方法 是 在 信息 隐藏 过 程 中 适当 提高 擦 除 /编程 次 数 (N) ， 使 得 存储 单元 经 历 不 同 的 擦 除 / 编 程 过 程 ， 从 而 增 大 
存储 单元 间 编 程 时 间 的 差异 。 但 是 通过 实验 发 现 ， 在 擦 除 / 编 程 次 数 超过 5000 次 之 后 ， 其 减 小 位 错误 率 的 效果 就 很 小 了 。 第 二 个 方法 是 增 大 每 一 组 中 存储 单元 
的 个 数 ， 从 图 10-16 可 以 看 出 位 错误 率 随 着 每 一 组 中 存储 单元 的 个 数 的 增加 而 减 小 ， 但 每 一 组 中 存储 单元 的 个 数 增加 到 128 个 存储 单元 后 ， 其 减 小 位 错误 率 的 
效果 就 很 小 了 。 


BER 





50 100 150 200 250 
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图 10-16 ”位 错误 率 


(2) 信息 隐藏 速度 


Wang 等 人 通过 实验 测 得 ， 当 使 用 一 整 页 来 进行 信息 隐藏 时 ， 执 行 2000 次 探 除 /编程 操作 的 时 间 是 123.6s， 可 以 隐藏 2048 位 的 数据 ， 也 融 是 每 秒 可 以 隐藏 
16.6 (2048/123.6) 位 的 数据 。 


通常 NAND Flash 心 请 的 页 编程 时 间 是 200hs， 块 擦 除 时 间 是 700hs。 当 在 一 个 块 中 的 16 个 页 中 隐藏 2048 位 数据 时 ， 执 行 2000 次 编程 / 探 除 操作 ， 这 样 编 


程 / 擦 除 融 需 要 19.5s， 所 以 如 果 除 去 其 他 操作 的 时 间 消 耗 ， 信 息 隐 藏 的 速度 上 限 是 每 秒 可 仓 储 105 位 的 数据 。 
(3) 可 检测 性 


本 方案 是 通过 部 分 编程 操作 改变 NAND Flash 存 储 单元 的 编程 时 间 ， 并 通过 各 分 组 存储 单元 的 平均 编程 时 间 的 差异 来 进行 信息 隐藏 。 接 下 来 殉 需 要 验证 经 
过 “特殊 操作 ”之 后 的 NAND Flash 人 存储 单元 是 否 能 够 与 正常 使 用 的 仓储 单元 区 分 出 来 。 


信息 隐藏 的 过 程 并 没有 改变 存储 单元 的 功能 ， 即 这 些 人 存储 单元 仍然 能 够 进行 读 、 写 、 探 除 操 作 。 政 手 只 能 通过 检查 存储 单元 的 部 分 编程 时 间 来 推测 可 能 被 
来 进行 信息 隐藏 的 存储 单元 位 置 ， 但 是 也 可 以 解释 为 是 正常 使 用 NAND Flash 时 导致 的 存储 单元 编程 时 间 的 差异 性 。 而 且 ， 若 敌手 不 知道 隐藏 密 铀 ， 仍 然 不 
能 恢复 隐藏 的 数据 。 


磺 


10.2.4 ”提取 密 钥 


随 着 电子 设备 和 信息 传输 技术 的 不 断 友 展 ， 为 确保 信息 的 机 密 性 和 完整 性 ， 密 码 运算 广泛 应 用 于 信息 的 传输 和 存储 。 影 响 密码 运算 安全 的 有 两 个 因素 ， 即 
密码 算法 的 安全 性 和 密 钥 的 安全 性 。 密 码 算 法 的 安全 性 由 密码 算法 设计 者 在 设计 算法 的 时 候 通 过 理论 论证 ,但 是 在 实际 的 应 用 中 ， 密 钥 的 安全 性 却 面临 着 多 方 
面 的 问题 ， 如 密 钥 的 存储 安全 和 运行 时 安全 等 。 密 钥 所 能 提供 的 安全 性 等 级 取决 于 攻击 者 需要 花费 多 少 努 力 才能 获得 这 个 密 钥 。 近 几 年 对 于 密 钥 的 攻击 手段 得 
到 了 “ 速 的 发 展 ， 传 统 的 密 钥 存 储 方案 受到 了 极 大 挑战 。 


传统 密 钥 人 存储 机 制 将 密 钥 人 存储 在 密码 运算 设备 中 。 使 用 片 外 存储 的 密 钥 极 易 受 到 探 针 攻击 ， 如 使 用 逻辑 分 析 仪 融 能 十 分 方便 地 读 取 片 外 存储 的 密 钥 。 
此 ， 和 存储 机 制 大 多 选择 了 刻 入 式 片 内 存储 系统 ， 可 以 在 一 定 程度 上 防止 探 针 攻击 。 然 而 ， 不 管 是 片 外 存储 还 是 上 户 内 和 存储， 传统 存储 都 将 密 钥 以 数字 形式 永久 地 
存储 在 设备 中 。 当 设备 断 电 之 后 ， 甘 谋 已 久 的 攻击 者 可 以 通过 一 系列 的 攻击 手段 来 读 取 存储 中 的 密 钥 ， 这 一 点 使 得 密 钥 存 储 面 临 着 很 大 的 威胁 。 传 统 密 钥 存储 
机 制 中 还 有 一 种 方法 就 是 使 用 市 电池 的 密 钥 存 储 方案 ， 当 电路 检测 到 有 非法 入 侵 读 取 密 钥 的 时 候 ， 电 池 断 电 擦 除 保 存 于 RAM 中 的 密 钥 ， 这 样 攻击 者 束 无 法 获 
得 密 钥 信 息 ， 但 是 这 种 方案 的 稳定 性 较 差 ， 容易 受到 震动 、 电 池 寿 命 等 因素 的 影响 。 


鉴于 传统 密 钥 存储 方案 的 局 限 性 ，PUF 方 法 为 密 钥 存 储 机 制 带 来 了 一 种 全 新 的 方案 。 
密 钥 不 以 数字 形式 存储 在 设备 上 。 

. 仅仅 当 需 要 的 时 候 才 从 设备 电路 中 提取 密 铀 。 

. 密 负 一 旦 使 用 之 后 ， 可 以 将 内 部 的 寄存 器 和 存储 中 的 密 钥 全 部 删 去 。 


基于 物理 不 可 克隆 功能 的 密 钥 存 储 方案 所 提供 的 安全 级 别 是 前 所 未 有 的 ， 因 为 当 密码 设备 断 电 的 时 候 ， 设 备 内 没有 以 数字 形式 存储 的 密 铀 ， 所 以 即使 攻击 
者 使 用 现 有 的 物理 攻击 手段 也 无 法 读 取 到 设备 中 存储 的 秘密 信息 。 


多 个 利用 物理 不 可 克隆 功能 的 方法 来 产生 密 钥 的 方案 都 是 利用 FPGA 平 台 上 的 SRAM 的 物理 特性 。 为 了 保证 由 硬件 产生 的 密 钥 的 可 靠 性 ， 传 统 的 方法 是 利 
用 Fuzzy Extractor 方 案 来 保证 产生 密 钥 的 可 靠 性 。Fuzzy Extractor 方 案 中 利用 的 是 纠 错 码 (Error-Correcting Code，ECC) 和 散 列 背 数 ， 然 而 纠 错 码 不 适用 
于 硬件 资源 有 限 的 电子 设备 : 首先 ， 由 于 外 界 条 件 的 影响 ， 直 接 利用 硬件 的 物理 不 可 克隆 功能 产生 的 变化 率 高 达 25%， 使 得 直接 利用 纠 错 码 来 保证 密 钥 的 稳定 
性 是 不 可 行 的 ; 其次， 纠 错 码 的 计算 过 程 通常 是 在 专门 的 硬件 世 片 中 完成 ， 需 要 大 量 的 计算 单元 以 及 电量 的 消耗 ， 并 且 随 着 需要 纠 错位 数 的 增加 而 呈 指 数 增 
加 ; 纠 错 码 需要 和 存储 额外 的 辅助 数据 来 保证 生成 密 钥 的 可 靠 性 ， 然 而 这 些 辅助 数据 会 暴露 硬件 所 产生 的 相应 的 信息 ， 增 加 政 手 恢复 密 钥 的 可 能 性 ， 不 利于 系统 
安全 。 


随 着 NAND Flash 心 片 应 用 的 普及 ， 利 用 NAND Flash 的 物理 不 可 克隆 功能 来 产生 密 钥 的 方案 也 被 提出 。Jia 等 人 在 2015 年 提出 了 利用 NAND Flash 的 物理 
不 可 克隆 功能 (NFPUF) 来 产生 密 钥 的 方案 ， 首 先 在 NAND Flash 中 利用 部 分 擦 除 (partial erasure) 、 部 分 编程 (partial programming) 和 编程 干扰 
(program disturbance) 技术 来 提取 用 于 产生 密 钥 的 源 数据 ， 然 后 对 源 数据 进行 处 理 ， 提 出 了 利用 位 图 法 (bit map method) 和 位 置 图 法 (position-map 
method) 选择 具有 最 稳定 大 小 关系 的 源 数据 来 产生 密 铀 ， 从 而 避免 了 使 用 纠 错 码 等 方法 来 保障 密 钥 的 可 靠 性 ， 减 小 了 系统 开销 ， 增 加 了 密 钥 提 取 方 法 的 普 适 
性 。 接 下 来 对 该 方案 进行 详细 讲述 。 


1. 利 用 NFPUF 提 取 源 数据 


在 本 书 的 10.1 节 中 讲解 了 NAND Flash PUF 的 相关 原理 ， 此 处 不 再 敖 述 。 根 据 NAND Flash 存 储 单 元 阅 值 电压 因 氧 化 层 厚度 变化 而 变化 的 原理 ，Jia 等 人 提 
出 了 部 分 探 除 和 部 分 编程 法 来 提取 密 钥 源 数据 的 方法 ; 根据 各 存储 单元 之 间 相 互 干扰 的 原理 ， 提 出 了 编程 干扰 法 来 提取 密 钥 源 数 据 的 方法 。 


(1) 部 分 擦 除 


部 分 探 除 方法 的 原理 是 根据 在 心 片 制造 过 程 中 造成 的 各 个 人 存储 单元 的 “ 探 除 状态 ”的 国 值 电压 的 差异 性 ， 即 一 个 NAND Flash 心 片 中 各 个 存储 单元 在 擦 除 
前 和 擦 除 后 存储 单元 的 阅 值 电压 是 不 一 样 的 ， 所 以 各 个 存储 单元 由 逻辑 状态 “0”， 通 过 擦 除 操作 放电 变 成 逻辑 状态 “1”， 所 需要 的 时 间 也 是 不 一 样 的 。 因 此 
通过 减少 擦 除 操作 的 时 间 ， 即 在 一 个 块 中 执行 部 分 擦 除 操作 ， 导 致 各 个 存储 单元 会 呈现 出 不 同 的 逻辑 状态 。 


图 10-17 的 伪 代 码 说 明了 利用 部 分 探 除 法 ， 从 NAND Flash 中 提取 用 于 产生 密 钥 的 源 数据 的 过 程 ， 接 下 来 进行 详细 过 程 的 讲解 。 


Require: 
The number of block to erase (BlockNum); 
The number of page to read (PageN um): 
The number of cells to record (CellsN um); 
The time of each partial erasure operation (1.): 
The number of partial erasure operations (PEN um): 
Ensure: 
The number of partial erasure operations of each NAND Flash memory cell need 
to reach the erased state (RawPuf|lCellsNuml). 
: Erase(l BlockN um): 
: Programl( PageN um, 0): 
: for 1 = 11:1 <= PENum: 十 十 do 
PartiallyErase (I。e, BlockN um); 
ftead(l PagelN um); 
for All the selected cells to record do 
if | he first observation of the cell flips from 0 to 1 then 
RawPuf|ll he Position of the cell in the selected cells |= 1: 
end if 
end for 
: end for 
: for The cells have not flipped after PENum partial erasure operations do 
RawPuf|l{ he Position of the cell in the selected cellsl= PENum+!1: 


: end for 


中 

4: 
与 : 
0: 
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图 10-17 “部 分 擦 除法 算法 


首先 ， 选 中 一 个 NAND Flash 块 (BlockNum) ， 擦 除 此 块 ， 使 得 此 块 中 所 有 的 存储 单元 变 成 逻辑 状态 “1”。 从 该 块 中 选中 一 页 (PageNum) ， 并 对 该 
页 进行 编程 ， 使 得 该 页 中 所 有 的 存储 单元 变 成 逻辑 状态 “0”。 然 后 ， 对 所 选中 的 块 进行 部 分 探 除 操作 ， 每 次 部 分 探 除 操作 持续 时 间 为 Te， 共 执行 PENum 次 部 
分 擦 除 操作 。 由 于 部 分 擦 除 操作 可 能 导致 选中 页 (PageNum) 中 的 存储 单元 友 生 位 翻转 现象 ， 即 由 逻辑 状态 “0” 变 成 逻辑 状态 “1”。 所 以 ， 每 次 执行 部 分 
探 除 操作 后 ， 读 选中 页 (PageNum) 中 存储 单元 的 数据 ， 当 存储 单元 发 生 位 翻转 现象 后 ， 记 录 此 时 执行 的 部 分 擦 除 操 作 的 次 数 。 当 执行 PENum 次 部 分 擦 除 
操作 后 ， 将 仍 未 发 生 位 翻转 现象 的 存储 单元 所 需要 的 部 分 擦 除 操作 的 次 数 记 作 PENum+1。 最 后 ， 将 选中 页 中 所 有 存储 单元 的 记录 的 部 分 擦 除 操作 的 次 数组 合 
起 来 (RawPufD) ， 组 成 从 该 页 中 提取 的 用 于 产生 密 钥 的 源 数 据 。 


(2) 部 分 编程 


部 分 编程 方法 的 原理 是 基于 在 心 片 制造 过 程 中 造成 的 各 个 人 存储 单元 “编程 状态 ”的 靖 值 电压 的 差异 性 。 即 一 个 NAND Flash 心 片 中 各 个 存储 单元 在 编程 前 
和 编程 后 的 存储 单元 的 阅 值 电压 是 不 一 样 的 ， 所 以 ， 各 个 存储 单元 由 逻辑 状态 “1” 通 过 编程 操作 充电 变 成 逻辑 状态 “0” 所 需要 的 时 间 也 是 不 一 样 的。 因此 通 
过 减少 编程 操作 的 时 | 间 ， 即 在 一 个 页 中 执行 部 分 编程 操作 ， 各 个 存储 单元 会 呈现 出 不 同 的 逻辑 状态 。 接 下 来 对 利用 部 分 编程 法 从 NAND Flash 中 提取 用 于 产生 
密 钥 的 源 数 据 的 过 程 进行 详细 讲解 。 


首先 ， 选 中 一 个 NAND Flash 块 (BlockNum) ， 擦 除 此 块 ， 使 得 此 块 中 所 有 的 存储 单元 变 成 逻辑 状态 “1”。 从 该 块 中 选中 一 页 (PageNum) ， 并 对 该 
页 进行 部 分 编程 操作 ， 每 次 部 分 编程 操作 持续 时 间 为 Tp， 共 执行 PPNum 次 部 分 编程 操作 。 由 于 部 分 编程 操作 可 能 导致 选中 页 (PageNum) 中 的 存储 单元 会 
上 友 生 位 翻转 现象 ， 即 由 逻辑 状态 “1” 变 成 逻辑 状态 “0”。 所 以 ， 每 次 执行 部 分 编程 操作 后 ， 读 选中 页 (PageNum) 中 存储 单元 的 数据 ， 当 存储 单元 友 生 位 
翻转 现象 后 ， 记 录 此 时 执行 的 部 分 编程 操作 的 次 数 。 当 执行 PPNum 次 部 分 编程 操作 后 ， 将 仍 未 友 生 位 翻转 现象 的 存储 单元 所 需要 的 部 分 编程 操作 的 次 数 记 作 
PPNum+1。 最 后 ， 将 选中 页 中 所 有 存储 单元 的 记录 的 部 分 编程 操作 的 次 数组 合 起 来 (RawPuf) ， 组 成 从 该 页 中 提取 的 用 于 产生 密 钥 的 源 数 据 。 


(3) 编程 干扰 


与 上 述 两 种 方法 不 同 ， 编 程 干扰 基于 由 NAND Flash 心 片 存 储 单元 紧密 的 组 织 结构 造成 相 邻 的 页 互相 影响 的 现象 。 对 一 个 NAND Flash 页 进行 多 次 重复 编 
程 操作 ， 将 导致 其 相 邻 页 中 的 存储 单元 发 生 位 翻转 现象 。 接 下 来 对 利用 编程 干扰 法 从 NAND Flash 中 提取 用 于 产生 密 钥 的 源 数 据 的 过 程 进 行 详细 讲解 。 


首先 ， 选 中 一 个 NAND Flash 块 (BlockNum) ， 擦 除 此 块 ， 使 得 此 块 中 所 有 的 存储 单元 变 成 逻辑 状态 “1”。 从 该 块 中 选中 一 页 (PageNum) 并 对 该 页 
进行 重复 的 编程 操作 ， 共 执行 PDNum 次 编程 操作 。 由 于 每 次 编程 操作 可 能 导致 其 相 邻 页 中 的 存储 单元 友 生 位 翻转 现象 ， 即 由 逻辑 状态 “1” 变 成 逻辑 状 
人 态 “0”。 所 以 ,每 次 执行 编程 操作 后 ， 读 选中 页 (PageNum) 的 相 邻 页 中 存储 单元 的 数据 ， 当 存储 单元 故 生 位 翻转 现象 后 ， 记 录 此 时 执行 的 编程 操作 的 次 
数 。 当 执行 PDNum 次 编程 操作 后 ， 将 仍 未 友 生 位 翻转 现象 的 存储 单元 所 需要 的 编程 操作 的 次 数 记 作 PDNum+1。 最 后 ， 将 选中 页 的 相 邻 页 中 所 有 存储 单元 的 
记录 的 编程 操作 的 次 数组 合 起 来 (RawPuf[) ， 组 成 从 选中 页 中 提取 的 用 于 产生 密 钥 的 源 数据 。 


2. 从 源 数据 中 提取 密 钥 


利用 NAND Flash 的 物理 不 可 克隆 功能 (NFPUF) 方法 ， 通 过 重复 的 编程 或 者 擦 除 操作 ， 从 每 一 个 存储 单元 中 提取 源 数据 。 在 提取 这 些 源 数据 的 过 程 中 不 
可 避免 地 会 受到 外 界 环境 的 影响 ， 比 如 存储 单元 之 间 的 电子 吕 声 的 影响 、 外 界 温 度 的 影响 等 ， 导 致 所 提取 的 源 数据 并 不 是 固定 不 变 的 ， 而 是 具有 一 定 的 变化 幅 
度 。 因 此 ， 通 过 NFPUF 方 法 从 每 一 个 存储 单元 中 提取 的 源 数据 不 适用 于 直接 用 来 充当 密 钥 。 


为 了 保证 密 钥 的 可 靠 性 ,传统 的 方法 是 利用 Fuzzy Extractor 方 案 来 保证 产生 密 钥 的 可 靠 性 ， 其 中 具体 用 到 的 技术 就 是 纠 错 码 (ECC) 和 散 列 冰 数 。 纠 错 码 
和 散 列 了 消 数 的 实现 需要 大 量 的 计算 单元 和 电量 ， 从 而 不 适用 于 硬件 资源 有 限 的 存储 设备 。 为 了 利用 通过 NFPUF 方 法 从 每 一 个 存储 单元 中 提取 的 源 数 据 中 来 提 
取 密 钥 ， 需 要 以 最 小 的 错误 率 来 保证 密 钥 的 可 靠 性 ， 同 时 避免 使 用 纠 错 码 等 技术 ， 从 而 不 需要 存储 大 量 的 辅助 数据 ， 在 提高 系统 的 安全 性 的 同时 ， 增 加 提取 密 
钥 的 方案 的 普 适 性 ， 即 使 得 该 方案 适用 于 硬件 资源 较 少 的 存储 系统 。 


通常 SLC 型 NAND Flash 的 探 写 寿命 是 10 万 次 ， 而 MLC 型 NAND Flash 的 擦 写 寿命 是 1 万 次 。 重 复 的 擦 除 、 编 程 操作 导致 从 NAND Flash 中 提取 的 源 数据 会 
产生 变化 ， 从 图 10-18a 中 可 以 看 出 ， 从 一 页 中 所 有 存储 单元 ( 横 轴 ) 中 提取 的 源 数据 ( 纵 轴 ) 呈现 不 规则 的 分 布 ， 并 且 有 着 较 大 的 差异 。 但 是 从 图 10-18b 中 
可 以 看 出 ， 昌 然 从 每 个 存储 单元 中 提取 的 源 数 据 随 着 擦 除 、 编 程 操 作 次 数 ( 横 轴 ) 的 增加 而 呈现 下 降 趋 势 ， 但 是 在 整个 NAND Flash 心 片 的 寿命 周期 内 ， 从 某 
些 不 同 存储 单元 中 提取 的 源 数据 ( 纵 轴 ) 的 大 小 关系 是 固定 的 。 所 以 ， 在 整个 NAND Flash 芯 片 的 寿命 周期 内 ， 如 果 能 找到 拥有 最 稳定 的 源 数 据 大 小 关系 的 存 
储 单元 ， 并 将 这 些 源 数 据 之 间 的 大 小 关系 转化 成 二 进 制 数 从 而 表示 密 钥 ， 这 样 就 只 需要 记录 相应 存储 单元 的 位 置 作为 辅助 数据 ， 而 不 需要 其 他 任何 开销 较 大 的 
纠 错 码 等 技术 。 
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a) 一 页 中 的 各 个 存储 单元 
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各 存储 单元 中 提取 的 源 数 据 
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b) 操作 次 数 
图 10-18 ” 源 数 据 关系 图 


Jia 等 人 介绍 了 两 种 从 源 数据 中 提取 密 钥 的 方法 ， 第 一 种 是 位 图 法 ， 第 二 种 是 位 置 图 法 。 利 用 这 两 种 方法 可 以 选取 在 NAND Flash 寿 命 周 期 内 具有 最 稳定 大 


小 天 系 源 数据 所 对 应 的 存储 单元 ， 然 后 利用 所 选取 的 存储 单元 的 源 数据 来 产生 密 铀 。 图 10-19 摘 述 的 是 这 两 种 方法 的 操作 过 程 实 例 ， 首 先 从 一 页 中 的 10 个 存储 
单元 中 提取 源 数据 RawPuf0]， 这 10 个 人 存储 单元 在 该 页 中 的 起 始 地 址 是 0x0065 到 0x006e (由 于 目前 常用 的 NAND Flash 页 的 容量 的 大 小 为 512B ~ 4KB， 所 以 才 
由 16 位 数据 表示 存储 单元 的 位 置 ) 。 


存储 单元 位 置 | 0x0065 0x0066 0x0067 0x0068 0x0069 0x006a 0x006b 0x006c 0x006d 0x006e 
RawPnuf[ | 173 Sf / 127 / 33 pa 19 到 
87 


ADvaluel[ | 









102 159 40 


BitMap [ ] ] 0 ] ] 0 


SortedRawPuf | 


Ne 


25 5 57 59 60 88 127 175 214 
PairRawPuf[ ] 127 19 175 25 


SS 214 


方法 2: 位 置 图 法 


PositionMap[ ] 0x0069 0x006d 0x0065 0x006a 0x006b 0x006c 


图 10-19 ” 密 钥 提取 法 
(1) 位 图 法 
首先 ， 两 两 比较 相 邻 存储 单元 源 数 据 的 大 小 ， 并 记录 它们 之 间 的 绝对 值 (ADvaluel]) 。 然 后 ， 对 得 到 的 绝对 值 从 小 到 大 进行 排序 ， 选 择 绝对 值 较 大 部 分 
的 存储 单元 对 来 生成 密 钥 。 对 选中 的 存储 单元 对 分 配 “1”， 对 没有 选中 的 存储 单元 对 分 配 “0” (图 10-19 中 选择 了 3 对 存储 单元 对 ) ， 将 分 配 的 数据 组 成 位 
图 法 的 辅助 数据 (BitMap[]) 。 比 较 选 中 存储 单元 对 的 源 数据 ， 若 存储 单元 对 中 处 于 靠 前 位 置 的 存储 单元 的 源 数据 较 大 ， 则 在 密 钥 (Key1[) 中 记录 “1”， 
否则 就 在 密 钥 (Key1[0) 中 记录 “0”。 最 后 ， 将 所 选择 的 各 存储 单元 对 中 所 提取 的 密 钥 组 合 起 来 ， 形 成 最 后 的 密 钥 。 


(2) 位 置 图 法 


首先 ， 将 存储 单元 的 源 数据 从 小 到 大 进行 排序 (3ortedRawPuf0) ， 从 较 小 的 源 数据 中 选择 一 部 分 存储 单元 ， 并 从 较 大 的 源 数据 中 选择 一 部 分 存储 单 
元 ， 两 两 配对 组 成 所 选择 的 存储 单元 对 (图 10-19 中 选择 了 3 对 存储 单元 ) 。 然 后 对 所 选择 的 存储 单元 对 的 源 数 据 根据 存储 单元 的 位 置 先 后 进行 排列 
(PairRawPuf0) ， 如 果 位 置 靠 前 的 存储 单元 的 源 数据 较 大 ， 则 在 密 钥 (Key2[) 中 记录 “1”， 人 否则 融 在 密 钥 (Key20) 中 记录 “0”。 最 后 ， 将 选中 的 存储 
单元 的 位 置信 息 作为 辅助 数据 (PositionMap[]) ， 并 将 所 选择 的 各 存储 单元 对 中 所 提取 的 密 钥 组 合 起 来 ， 形 成 最 后 的 密 钥 。 


注意 ， 位 图 法 和 位 置 图 法 的 辅助 数据 只 是 表示 所 选择 存储 单元 的 位 置信 息 ， 与 从 存储 单元 中 提取 的 源 数据 的 大 小 关系 无 天 ， 从 存储 单元 中 提取 的 源 数 据 是 
NAND Flash 心 片 在 制造 过 程 中 的 差异 性 导致 的 ， 是 一 个 随机 的 过 程 ， 所 以 这 些 辅 助 数 据 不 会 泄露 密 钥 中 各 位 的 极 性 。 


在 这 部 分 中 我 们 介绍 Jia 等 人 使 用 的 实验 设备 ， 以 及 对 该 密 钥 提 取 方 案 可 靠 往 、 安 全 性 方面 的 评估 。 
(1) 实验 设备 


jia 等 人 利用 了 一 个 PCB 测 试 开 发 板 ， 这 个 开发 板 上 含有 一 个 STM32F103VCT6 控 制 器 (32 位 的 ARM Cortex-M3 的 精简 指令 核 ) 。 利 用 这 个 控制 器 ， 可 以 
向 NAND Flash 心 睛 中 的 任意 物理 位 置 友 送 编程 、 读 取 、 擦 除 命令 。 这 个 简单 常用 的 设备 说 明 Jia 等 人 所 提出 的 密 钥 提 取 方 案 对 硬件 没有 特殊 的 要 求 ， 适 用 于 流 
行 的 具有 NAND Flash 忌 片 的 存储 设备 。Jia 等 人 对 表 10-3 中 的 NAND Flash 必 片 进行 了 测试 ， 这 些 必 片 来 自 于 5 个 不 同 的 生产 厂家， 包括 不 同类 型 、 容 量 的 SLC 
和 MLC 型 芯片 。 


表 10-3 ”测试 NAND Flash 芯 片 


1 梓 1 加 | 总 | 站 轨 | 加 
un 


(2) 实验 结果 

为 了 评估 利用 NAND Flash 物 理 不 可 克隆 功能 (NFPUF) 方案 的 性 能 ， 我 们 需要 分 析 所 生成 密 钥 的 安全 性 和 可 靠 性 ， 所 以 接 下 来 分 别 对 所 生成 密 钥 的 速 
度 、 再 生性 、 唯 一 性 与 随机 性 等 方面 进行 详细 评估 。 

` 速度 (speed) 

密 钥 生成 与 再 生成 的 过 程 都 需要 对 NAND Flash 心 片 进 行 多 次 的 编程 和 擦 除 操 作 ， 所 以 密 钥 生成 的 速度 与 所 选取 的 NAND Flash 心 片 的 编程 和 擦 除 特 性 有 
着 密切 的 关系 。 

首先 从 所 选取 的 NAND Flash 心 片 的 数据 手册 中 查 到 平均 块 编程 时 间 (tBERS) 和 平均 页 编程 时 间 (tpROG) ， 然 后 通过 多 次 实验 确定 每 一 个 心 月 执行 的 部 
分 块 擦 除 操作 的 时 间 (Te) 和 部 分 页 编程 操作 时 间 (Tp) ， 通 过 大 量 的 实验 表明 ， 当 部 分 块 探 除 的 时 间 大 约 为 平均 块 编程 时 间 的 1/12， 而 部 分 页 编程 时 间 大 约 
为 平均 页 编程 时 间 的 1/20 时 ， 可 以 从 每 一 个 人 存储 单元 中 提取 出 明显 不 同 的 源 数据 。 

接 下 来 需要 确定 每 一 个 心 片 需要 执行 的 部 分 块 擦 除 操作 次 数 (PENum) 、 部 分 页 编程 操作 次 数 (PPNum) 、 重 复 页 编程 操作 次 数 (PDNum) 。 对 于 所 
选取 的 NAND Flash 心 片 ， 利 用 所 选取 的 部 分 块 探 除 操作 时 间 (Te) 对 一 个 块 进行 部 分 块 擦 除 操作 ， 观 察 所 选 块 中 99% 的 存储 单元 被 擦 除 (从 逻辑 状 
态 “0” 变 成 逻辑 状态 “1”) 时 所 执行 的 部 分 块 探 除 操作 次 数 ， 以 此 来 确定 所 选 NAND Flash 心 片 的 部 分 块 擦 除 操作 次 数 (PENum) 。 利 用 所 选取 的 部 分 页 
编程 操作 时 间 (Tp) 在 一 个 页 中 进行 部 分 页 编程 操作 ， 观 察 所 选 的 页 中 99% 的 存储 单元 被 编程 (从 风 辑 状态 “1” 变 成 逻辑 状态 “0”) 时 所 执行 的 部 分 页 编程 
操作 次 数 ， 以 此 来 确定 所 选 NAND Flash 心 片 的 部 分 页 编程 操作 次 数 (PPNum) 。 最 后 ， 在 一 个 页 中 重复 地 进行 完整 的 页 编程 操作 ， 观 察 所 选 的 页 的 相 邻 物 
理 页 中 99% 的 存储 单元 被 编程 (从 风 辑 状态 “1” 变 成 逻辑 状态 “0”) 时 所 执行 的 页 编程 操作 次 数 ， 以 此 来 确定 所 选 NAND Flash 心 片 的 重复 页 编程 操作 次 数 


(PDNum) 。 通 过 大 量 的 实验 验证 ，Jia 等 人 对 所 选取 的 NAND Flash 心 片 确定 了 表 10-4 中 的 各 个 参数 。 


表 10-4 ”所 选取 NAND Flash 芯片 的 操作 参数 


B 50 x00 | 1 | 2 | 0 
C 700 200 200 200 3017 
D 700 200 200 200 本 过 本 
6 3 200 240 | 3419 


根据 表 10-4 中 确定 的 所 选取 NAND Flash 心 片 的 时 间 参 数 、 操 作 次 数 参数 ， 从 心 片 中 提取 用 于 生成 密 钥 的 源 数 据 的 速度 如 表 10-5 所 示 (单位 是 Kbit/s) 。 
从 表 10-5 中 可 以 看 出 ， 源 数据 提取 的 最 小 速度 是 7.35Kbit/s， 最 大 速度 是 22.38Kbit/s。 由 于 三 种 提取 源 数据 所 需要 的 具体 操作 不 同 ， 三 种 操作 的 速度 从 大 到 小 
依次 是 部 分 编程 操作 、 部 分 探 除 操作 、 编 程 干扰 操作 。 


表 10-5 源 数据 提取 速度 


应 用 位 图 法 从 源 数据 提取 密 钥 时， 为 了 获得 一 个 位 错误 率 小 于 10-6 的 128 位 长 度 的 密 钥 ， 需 要 18.28Kbit 长 度 的 源 数据 ， 因 此 大 约 需要 816.8ms ~ 2.48s。 
应 用 位 置 图 法 从 源 数据 提取 密 钥 时 ， 为 了 获得 一 个 位 错误 率 小 于 10-6 的 128 位 长 度 的 密 钥 ， 只 需要 2.1Kbit 长 度 的 源 数据 ， 因 此 大 约 只 需要 93.83ms ~ 
285.7ms。 人 在 测试 提取 密 钥 速度 的 实验 过 程 中 ， 所 选用 的 开发 板 上 的 ARM 控 制 器 的 频率 只 有 72MHz， 而 且 其 异步 通信 接口 在 很 大 程度 上 限制 了 提取 源 数据 的 
速度 。 如 果 采 用 频率 更 高 的 控制 器 ， 则 提取 密 钥 的 速度 会 大 大 增加 。 


. 再 生性 (reproducibility) 


为 了 评估 NFPUF 生 成 密 钥 的 再 生性 ， 需 要 测试 片 内 变化 率 (intra-chip variation) ， 也 就 是 从 一 个 NAND Flash 芯 片 的 相同 位 置 乡 次 提取 的 源 数 据 的 变化 
率 ， 理 论 上 ， 最 优 的 片 内 变化 率 应 该 为 0。 


为 了 避免 使 用 纠 错 码 (ECC) ，Jia 等 人 提出 了 位 图 法 和 位 置 图 法 来 选择 NAND Flash 芯 片 中 具有 最 稳定 大 小 关系 源 数据 的 存储 单元 。 为 了 确保 提取 密 钥 的 
方案 在 整个 NAND Flash 芯 片 的 使 用 寿命 中 的 可 用 性 ， 需 要 获得 位 错误 率 小 于 10" 的 密 钥 。 用 于 参考 ， 选 择 提取 128 位 长 度 的 密 钥 。 
Jia 等 人 测试 了 随 着 温度 变化 和 心 片 使 用 程度 变化 情况 下 密 钥 生成 的 片 内 变化 率 。 图 10-20 表 示 了 利用 位 图 法 ， 从 X 位 的 源 数据 中 提取 Y 位 的 密 钥 的 片 内 变化 


率 情况 ， 横 轴 表 示 Y/X (由 于 位 图 法 和 位 置 图 法 都 是 将 两 个 源 数据 之 间 的 大 小 关系 转化 为 一 位 的 密 铀 ， 所 以 Y/X 的 最 大 值 是 0.5) ， 纵 轴 表 示 平 均 片 内 变化 率 . 
其 中 ， 左 图 是 片 内 变化 率 在 不 同 温度 下 的 变化 情况 ， 右 图 是 片 内 变化 率 在 不 同 的 芯片 使 用 程度 下 的 变化 情况 。 
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图 10-20 位 图 法 在 不 同 温度 及 使 用 情况 下 的 片 内 变化 率 


图 10-21 表 示 了 利用 位 置 图 法 ， 同 样 从 X 位 的 源 数据 中 提取 Y 位 的 密 钥 的 片 内 变化 率 情况 ， 横 轴 表 示 Y/X， 纵 轴 表 示 平 均 片 内 变化 率 。 其 中 ， 左 图 是 片 内 变 
化 率 企 不 同 温 硫 下 的 变化 情况 ， 右 图 是 片 内 变化 率 在 不 同 的 心 片 使 用 程度 下 的 变化 情况 。 


温度 的 变化 会 影响 NAND Flash 和 存储 单元 中 热 噪声 的 幅度 ， 但 是 不 会 影响 随机 电子 噪声 (RTN) 的 幅度 。 由 于 本 方案 提取 源 数据 主要 是 受 随机 电子 噪声 的 
影响 ， 所 以 从 图 10-20 和 图 10-21 中 可 以 看 出 ,温度 的 变化 对 提取 密 钥 的 片 内 变化 率 的 影响 很 小 。 
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图 10-21 位 置 图 法 在 不 同 温度 及 使 用 情况 下 的 片 内 变化 率 


NAND Flash 心 片 都 有 一 定 的 使 用 寿命 ， 随 着 擦 除 、 编 程 操作 的 增加 ， 各 个 存储 单元 中 的 隧道 氧化 层 会 逐渐 老化 ， 导 致 从 各 个 存储 单元 中 提取 的 源 数 据 会 
呈现 减 小 的 趋势 。 但 是 通过 实验 验证 ， 从 各 个 存储 单元 中 提取 的 源 数 据 之 间 的 大 小 关系 是 稳定 的 ， 所 以 从 图 10-20 和 图 10-21 中 可 以 看 出 ， 心 片 使 用 程度 对 提 
取 密 钥 的 片 内 变化 率 的 影响 也 很 小 。 


在 位 图 法 中 ， 当 Y (提取 密 钥 位 数量 ) 与 X ( 源 数据 位 数量 ) 的 比例 从 0.5 下 降 到 0.055 时 ， 所 提取 密 钥 的 片 内 变化 率 相应 的 从 14.42% 下 降 到 小 于 10-6。 当 
Y/X 取 0.055 时 ， 提 取 位 错误 率 小 于 10-6 的 128 位 密 钥 只 需要 2340 个 存储 单元 ， 辅 助 数 据 的 长 度 为 2340/2=1.14Kbit。 


在 位 置 图 法 中 ， 当 Y 与 X 的 比例 从 0.5 下 降 到 0.474 时 ， 所 提取 密 钥 的 片 内 变化 率 相应 的 从 2.3x10 了 下 降 到 小 于 10-6。 当 Y/X 取 0.474 时 ， 提 取 位 错误 率 小 于 
10-6 的 128 位 密 钥 只 需要 270 个 存储 单元 ， 辅 助 数据 的 长 度 为 128x16x2=4Kbit。 


从 上 面 的 分 析 可 以 看 出 ， 如 果 要 提取 位 错误 率 小 于 10-e 的 128 位 密 钥 ， 位 图 法 与 位 置 图 法 相 比 ， 前 者 需要 更 多 的 存储 单元 ， 而 需要 的 辅助 数据 的 长 度 较 
短 。 所 以 ， 我 们 可 以 在 实现 过 程 中 根据 具体 的 需求 进行 选择 。 


通过 纠 错 码 实现 的 密 钥 提取 方案 通常 需要 3 ~ 10Kb 的 源 数据 (位 错误 率 在 15% 时 ) ， 辅 助 数 据 的 长 度 达 到 3 ~ 15Kb。 而 且 ， 纠 错 码 的 纠 错 能 力 是 有 限 的 ， 
右 密 钥 的 错误 率 超过 所 选用 的 纠 错 码 的 纠 错 能 力 ， 则 会 造成 密 铀 无 法 再 次 生成 。 因 此 ， 相 比 而 言 ，jia 等 人 提出 的 密 钥 提 取 广 法， 避免 使 用 纠 错 码 ， 可 以 以 更 小 
的 系统 代价 灵活 地 生成 密 钥 。 


` 唯一 性 (uniqueness) 


评估 NFPUF 生 成 密 钥 的 唯一 性 ， 需 要 测试 所 提取 密 钥 的 片 间 变 化 率 (inter-chip variation) ， 也 融 是 从 不 同 NAND Flash 心 请 提取 的 ， 或 者 是 同一 心 片 的 
不 同位 置 提取 的 密 钥 的 相关 性 。 理 论 上 ， 如 果 从 NAND Flash 和 存储 单元 中 提取 的 源 数据 是 随机 的 ， 那 么 从 不 同位 置 提取 的 k 密 钥 间 服从 N=k、P=0.5 的 二 项 分 布 
(NN 为 试验 次 数 ，P 为 事件 成 功率 ) ， 也 融 是 说 最 优 的 请 间 变 化 率 应 该 为 ?0%。 


图 10-22 表 示 的 是 利用 三 种 不 同 提取 源 数据 的 方法 所 提取 的 1000 对 128 位 密 钥 的 片 间 变 化 率 ， 依 次 是 部 分 页 编程 法 、 部 分 块 探 除 法 和 重复 页 编程 法 。 横 轴 
代表 从 不 同位 置 提取 的 128 位 密 钥 之 间 的 汉 明 距离 〈 即 不 同 的 位 总 数 ) ， 纵 轴 代 表 各 个 汉 明 距离 所 占 对 应 的 比例 。 从 图 中 的 曲线 可 以 看 出 ， 从 三 种 方法 提取 的 
128 位 密 钥 的 平均 汉 明 距离 为 63.91、63.94、59.98， 相 对 应 的 片 间 变化 率 为 49.93%、49.95%、49.86%， 均 非常 接近 最 优 的 片 间 变化 率 50%。 
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c) 编程 干扰 
图 10-22 片 间 变化 率 
. 随机 性 (randomness) 


为 了 检测 所 提取 密 钥 的 随机 性 ，jJia 等 人 在 不 同 温度 下 测试 了 1000 组 128 位 密 钥 中 “1 ”的 概率。 如 图 10-23 所 示 ，“1 ”的 概率 的 变化 范围 是 从 46.949% ~ 
53.62%， 非 常 接近 最 优 的 50% 的 比例 。 





-5 25 60 
温度 ('C) 
图 10-23 ”温度 对 随机 性 的 影响 


可 以 使 用 冯 - 诺 依 曼 校正 算法 来 保证 提取 密 钥 的 随机 性 ， 并 使 用 散 列 阔 数 来 保证 密 钥 对 灼 高 要 求 。 


本 草 参 考 文 献 


[1]Handschuh H, Trichina E.Securing Flash technology[C].Fault Diagnosis and Tolerance in Cryptography, 2007: 3-20. 


[2]Prabhu P, Akel A, et al.Extracting Device Fingerprints From Flash Memory by Exploiting Physical Variations[Cl]//International Conference 


on Trust and Trustworthy Computing. 


[3]Wang Y, et al.Flash Memory for Ubiquitous Hardware Security Functions: True Random Number Generation and Device 


Fingerprints[C].IEEE Symposium on Security and Privacy, 2012: 33-47. 


[4]S Yilek, T Ristenpart.When Good Randomness Goes Bad: Virtual Machine Reset Vulnerabilities and Hedging Deployed 
cryptography[C].Proceedings of the17th Annual Network and Distributed System Security Conference, 2010. 


[5]A Rukhin, J Soto, J Nechvatal.A Statistical Test Suite for Random and Pseudorandom Number Generators for Crytographic 
Applications[EB/OL].http://csrc.nist.gov/groups/ST/toolkit/rng/documents/SP800-22rev1a.pdf.2010. 


[6]P Koeberl, J Li, et al.A Practical Device Authentication Scheme Using SRAM PUFs[C].Proceedings of the4th International Conference on 
Trust and Trustworthy Computing, 2011: 63-77. 


[7]H Kurata, K Otsuga, et al.Random Telegraph Signal in Flash Memory: lts Impact on Scaling of Multilevel Flash Memory Beyond the90- 
nm NodelJ].lEEE Journal, 2007, 42 (6) : 1362-1369. 


[8]C Compagnoni, et al.Random Telegraph Noise Effect on the ProgRAMmed Threshold-Voltage Distribution of Flash Memories[lJ].Electron 
Device Letters, IEEE, 2009, 30 (9) : 984-986. 


[9]S-M Joe, et al.Threshold Voltage Fluctuation by Random Telegraph Noise in Floating Gate NAND Flash Memory String[J].Electron 
Devices，|EEE Transactions on, 2011, 58 (1) : 67-73. 


[10]Wang Y, Yu W, et al.Hiding Information in Flash Memory[Cl].Security and Privacy (SP) ，2013IEEE Symposium on, 2013: 271-285. 


[11]L Grupp, A Caulfield, et al.Characterizing Flash Memory: Anomalies, Observations, and Applications[C].In Proc.of the42nd 


International Symposium on Microarchitecture, 2009. 


[12]Maes R.et al.PUFKY: a Fully Functional PUF Based Cryptographic Key Generator[Cl.International Workshop on Cryptographic Hardware 
and Embedded Systems. 


[13]Bosch C, et al.Efficient Helper Data Key Extractor on FPGAs[Cl].International Workshop on cryptographic Hardware and Embedded 


Systems. 


[14]Guajardo J, et al.FPGA Intrinsic PUFs and Their Use for IP Protection[C].International Workshop on Cryptographic Hardware and 
Embedded Systems. 


[15]Dodis Y, et al.Fuzzy Extractors: How to Generate Strong Keys from Biometrics and Other Noisy DatalJ].SIAM J.Comput.2008, 38 (1) : 
97-139. 


[16]Linnartz J P, Tuyls P.New Shielding Functions to Enhance Privacy and Prevent Misuse of Biometric Templates[C].Audio-and-video-based 


Biometric Person Authentication. 
[17]Devadas S, Yu M.Secure and Robust Error Correction for Physical Unclonable Functions[J].IEEE Des.Test Comput.2010, 27 (1) : 48-65. 


[18]Suh G E, Devadas S.Physical Unclonable Functions for Device Authentication and Secret Key Generation[C].Proceedings of the44th 


Annual Design Automation Conference, 2007: 9-14. 


[19]Jia S, Xia L, Wang Z, et al.Extracting Robust Keys from NAND Flash Physical Unclonable Functions[C].International Information Security 
Conference, 2015: 437-454. 


[20]Delvaux J, Verbauwhede |.Attacking PUF-based Pattern Matching Key Generators Via Helper Data 
Manipulation[C].Cryptographers’ Track at the RSA Conference. 


[21]Wang C, Wong W F.Extending the Lifetime of NAND Flash Memory by Salvaging Bad Blocks[C].Proceedings of the Conference on 
Design, Automation and Test in Europe，2012: 260-263. 


[22]Xu S Q, Yu W k, et al.Understanding Sources of Variations in Flash Memory for Physical Unclonable Functions[C].IEEE6eth International 
Memory Workshop (IMW) , 2014: 1-4. 


[23]Bhargava M, Mai K.An Efficient Reliable PUF-based Cryptographic Key Generator in65nm CMOSI[C].Proceedings of the Conference on 
Design, 2014. 


[24]Krawczyk H.LFSR-based Hashing and Authentication[C].Annual International Cryptology Conference. 


第 11 草 展望 


存储 技术 是 信息 社会 的 基石 ， 理 想 的 存储 器 件 应 具有 非 挥 友 性 、 存 取 速 度 快 、 成 本 低 、 制 程 简单 、 数 据 存 储 密度 高 、 耗 电量 低 和 可 无 限 擦 写 等 特性 。 目 前 
的 状况 是 没有 任何 一 类 存储 器 技术 可 以 完全 达到 上 述 要 求 ， 只 能 针对 不 同 的 状况 采用 不 同 的 存储 器 。 如 果 单 一 存储 器 技术 具备 所 有 的 特性 ， 那 么 何必 需要 这 么 
多 种 存储 器 形式 呢 ， 尽 管 这 个 堪 称 “梦幻 存储 器 ”的 技术 还 未 出 现 ， 束 现实 环境 来 说 或 许 也 不 可 能 由 单一 存储 器 主 罕 整个 存储 市 场 ， 不 过 上 述 特性 可 以 说 是 未 
来 存储 器 技术 努力 的 方向 ， 下 面 束 几 个 可 能 具有 友 展 潜力 的 技术 作 一 探讨 。 


11.1 3D NANDI 内 和 存 


随 背 采用 传统 2D 平 面 制程 技术 的 NAND Flash 即 将 濒临 极限 ，NAND Flash 大 三 纷纷 开始 采用 3D 堆 到 制 程 技 术 来 增加 密度 。 什 么 是 3D NAND 闪 和 存 ” 我 们 
之 前 见 过 的 闪存 多 属于 Planar NAND 平 面 内 存 ， 也 叫 2D NAND 闪 存 或 者 直接 不 提 2D。3D 闪 存 ， 顾 名 思 义 ， 束 是 它 是 立体 堆 蔷 的， 如 图 11-1 所 示 。Intel 之 前 
用 盖 楼 为 例 介绍 了 3D NAND 内 存 ， 普 通 NAND 闪 存 是 平房 ， 那 么 3D NAND 内 存 训 是 高 楼 大 厦 ， 建 筑 面积 一 下 子 就 多 起 来 了 ， 理 论 上 可 以 无 限 堆 十 。3D 
NAND 闪 人 也 不 再 是 简单 的 平面 内 和 存 推 栈 ， 这 只 是 其 中 的 一 种 ， 还 有 VC ( 垩 直通 道 ) 、VG (垂直 栅 极 ) 两 种 结构 。 


2D NAND 





图 11-1 3D NAND Family 


11.1.1 3D NAND 闪 存 的 优势 


在 回答 3D NAND 闪 存 有 什么 优势 的 时 候 ， 我 们 先 要 了 解 平面 NAND 遇 到 了 什么 问题 。NAND 闪 存 不 仅 有 SLC、MLC 和 TLC 类 型 之 分 ， 为 了 进一步 提高 容 
量 、 降 低 成 本 ，NAND 的 制程 工艺 也 在 不 断 进步 ， 从 早期 的 50nm 一 路 狂奔 到 目前 的 15/16nm， 但 NAND 闪 存 与 处 理 器 不 一 样 ， 先 进 工艺 虽然 带 来 了 更 大 的 容 
量 ， 但 NAND 闪 存 的 制程 工艺 是 双 丸 剑 ， 容 量 提升 、 成 本 降低 的 同时 可 靠 性 及 性 能 都 在 下 降 ， 因 为 工艺 越 先进 ，NAND 的 氧化 层 越 薄 ， 可 靠 性 也 越 差 ， 厂 商 就 
需要 采取 额外 的 手段 来 弥补 ， 但 这 又 会 提高 成 本 ， 以 至 于 达到 某 个 点 之 后 制程 工艺 已 经 无 法 带 来 优势 了 。 


相 比 之 下 ，3D NAND 内 存 解 决 问题 的 思路 就 不 一 样 了 ， 为 了 提高 NAND 的 容量 、 降 低 成 本 ,厂商 不 需要 费 尽心 思 提 高 制程 工艺 ， 转 而 堆 革 更 多 的 层 数 束 
可 以 了 ， 这 样 一 来 3D NAND 闪 存 的 容量 、 性 能 、 可 靠 性 都 有 了 保证 ， 比 如 东芝 的 15nm NAND 容 量 密度 为 1.28Gb/mm“<， 而 三 星 32 层 堆栈 的 3D NAND 闪 存 
可 以 轻松 达到 1.87Gby/mm“<，48 层 堆栈 的 3D NAND 闪 存 则 可 以 达到 2.8Gbymm“。 


传统 的 平面 NAND 闪 存 现在 还 谈 不 上 末路 ， 主 流 工艺 是 15/16nm， 但 10/9nm 节 点 很 可 能 是 平面 NAND 最 后 的 机 会 ， 而 3D NAND 闪 存 还 会 继续 走 下 去 ， 
目前 的 堆 枝 层 数 不 过 32 ~ 48 层 ， 厂 商 们 还 在 研 友 64 层 甚至 更 高 层 数 的 堆栈 技术 。 


11.1.2 ”主要 厂商 的 3D NAND 闪 存 及 其 特色 


在 主要 的 NAND 闪 存 厂 商 中 ， 三 星 最 早 量 产 了 3D NAND 闪 存 ， 其 他 几 家 公司 在 3D NAND 闪 存量 产 上 要 落后 三 星 至 少 两 年 时 间 ，lntel 和 镁 光 2015 年 才 推 
出 3D NAND 闪 存 ，Intel 在 2016 年 4 月 初 才 发 布 了 首 蒜 3D NAND 闪 人 存 的 S9D， 不 过 主要 是 面向 企业 级 市 场 。 


这 些 厂商 的 3D NAND 闪 存 所 用 的 技术 不 同 ， 堆 栈 的 层 数 也 不 一 样 ， 而 Intel 在 常规 3D NAND 闪 存 之 外 还 开发 了 新 型 的 3D XPoint 闪 存 ， 它 与 目前 的 3D 
NAND 闪 存 有 很 大 不 同 ， 属 于 杀手 铜 级 产品 ， 值 得 关注 。 
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L 


三 星 是 NAND 闪 存 市 场 最 强大 的 厂商 ， 在 3D NAND 闪 存 上 也 是 一 路 领先 ， 他 们 最 早 在 2013 年 束 开 始 量 产 3D NAND 内 存 了 。 在 3D NAND 闪 人 存 路 线 上 ， 
三 星 也 研究 过 多 种 方案 ， 最 终 量 产 的 是 VG 地 直 栅 极 结构 的 V-NAND 闪 存 ， 目 前 已 经 友 展 了 三 代 V-NAND 技 术 ， 堆 栈 层 数 从 之 前 的 24 层 提高 到 了 48 层 ，TLC 类 
型 的 3D NAND 核 心 容量 可 达到 256Gb， 在 自家 的 840、850 及 950 系 列 SSD 上 都 有 使 用 。 


2. 东 芝 / 闪 迪 


东芝 是 闪存 技术 的 发 明 人 ， 昌 然 现在 的 份额 和 产能 被 三 星 超越 ， 不 过 东芝 在 NAND 及 技术 领域 依然 非常 强大 ， 其 很 早 就 投入 3D NAND 闪 存 研 发 了 ，2007 
年 东芝 独辟蹊径 推出 了 BiCs 技 术 的 3D NAND 东 芝 ， 之 前 我 们 也 提 到 了 2D NAND 闪 存 简单 堆栈 是 可 以 做 出 3D NAND 闪 存 的 ， 但 制造 工艺 复杂 ， 要 求 很 高 ， 而 
东 之 的 BiCs 闪 存 是 Bit Cost Scaling， 强 调 的 丈 是 随 NAND 规 模 而 降低 成 本 ， 宣 称 在 所 有 3D NAND 闪 人 存 中 BiCs 近 术 的 闪存 核 心 面积 最 低 ， 也 意味 着 成 本 更 
低 。 他 们 的 BiCS 内 存 2015 年 开始 量 产 ， 目 前 的 堆栈 层 数 是 48 层 ，MLC 类 型 的 核心 容量 为 128Gb，TLC 类 型 的 容量 可 达 256Gb， 预 计 会 在 日 本 四 日 市 的 Fab2 工 
厂 规模 量 产 。 


3.SK Hynix 


在 这 几 家 NAND 闪 存 厂商 中 ，SK Hynix 的 3D NAND 闪 人 存 最 为 低调 ， 相 关 报 道 很 少 ， 不 过 从 官网 公布 的 信息 来 看 ，SK Hynix 的 3D NAND 闪 存 已 经 发 展 了 3 
代 了 ，2014 年 Q4 推 出 第 一 代 ，2015 年 Q3 推 出 第 二 代 ，Q4 推 出 的 则 是 第 三 代 3D NAND 闪 存 ， 只 不 过 前 面 三 代 产品 主要 面向 eMCC5.0/5.1、UFS2.0 等 移动 市 
场 ，2016 年 推出 的 第 四 代 3D NAND 闪 存 则 会 针对 UFS2.1、SATA 及 PCI-E 产 品 市 场 。SK Hynix 的 3D NAND 内 存 堆栈 层 数 从 36 层 起 步 ， 不 过 真正 量 产 的 是 48 
层 堆栈 的 3D NAND 闪 人 存 ，MLC 类 型 的 容量 为 128Gb，TLC 类 型 的 容量 也 可 以 达到 256Gb。 


4.Intel 


Intel 和 和 镁 光 在 2015 年 宣布 联合 开发 全 新 的 3D XPoint 闪 存 技术 ， 但 是 使 用 该 技术 的 Optane 系 列 闪 存 却 从 预计 的 2016 年 年 底 延 迟到 了 2017 年 3 月 ，Intel 和 
镁 光 也 终于 推出 了 首 款 3D XPoint 产 品 P4800X。 相 比 于 NAND 闪 存 技术 ， 理 论 上 3D XPoint 的 传输 速度 和 使 用 寿命 是 前 者 的 1000 倍 ， 存 储 密度 则 是 前 者 的 10 
倍 。 不 过 现实 是 现 阶段 3D XPoint 技 术 可 能 还 未 达到 Intel 和 | 镁 光 所 宣传 的 那样 ， 从 相关 介绍 文件 来 看 ，P4800X 的 存储 容量 为 不 太 常见 的 375GB， 而 得 益 于 更 
高 的 存储 密度 ，P4800X 的 长 宽 都 分 别 只 有 同 容量 PCI-E NVMe 闪 存 必 片 的 一 半 。 至 于 传输 性 能 方面 ，Intel 和 镁 光 给 出 的 官方 数据 是 最 高 2400M B/s 的 读 取 速 
度 和 2000MB/s 的 写 入 速度 。 另 外 ，P4800X 的 随机 读 写 速度 分 别 可 达 550K IOPS 与 500K IOPS，NANDI 内 存 较 之 确实 有 差距 。 


11.2 相 变 存储 器 


相 变 存储 器 (PCM) 利用 特殊 材料 在 晶 态 和 非 晶 态 乙 间 相互 转化 时 所 表现 出 来 的 导电 性 差异 来 仓储 数据 。 相 变 人 存储 器 通 弟 是 利用 硫 族 化 合 物 在 晶 态 和 非 
晶 态 乙 间 巨 大 的 导电 性 差异 来 仓储 数据 的 一 种 信息 人 存储 妆 置 ， 它 利用 材料 可 逆转 的 物理 状态 变化 来 仓储 信息 ， 具 有 非 易 失 性 、 工 艺 扩 寸 小 、 人 存储 密度 高 、 循 环 
寿命 长 、 读 写 速 度 快 、 功 耗 低 、 抗 辐射 干扰 强 等 优点 。 


相 变 存储 器 介质 材料 在 一 定 条 件 下 会 在 非 晶体 状态 和 晶体 状态 之 间 友 生 转 变 ， 在 此 过 程 中 的 非 晶体 状态 和 晶体 状态 呈现 出 不 同 的 电阻 特性 和 光学 特性 ， 
此 ， 可 以 利用 “0” 和 “1” 分 别 表示 非 晶 态 和 晶 态 来 存储 数据 。PCM 写 “1” 是 一 个 中 温 结晶 的 过 程 ， 即 对 硫 族 化 合 物 施 加 一 个 时 间 较 长 、 强 度 中 等 的 电 脉冲 
进行 加 热 ， 使 其 温度 上 升 到 结晶 温度 以 上 、 溶 化 温度 以 下 ， 从 而 导致 结晶 ， 这 一 过 程 也 被 称 为 SET 过 程 ; PCM 写 “0” 是 一 个 高 温 涪 火 的 过 程 ， 即 使 用 一 个 强 
度 很 高 但 作用 时 间 很 短 的 电 脉冲 ， 使 得 硫 族 化 合 物 材料 在 温度 上 升 到 熔点 之 上 后 迅速 经 历 一 个 溯 火 (热量 快速 释放 ， 降 温 速 率 大 于 109KVs) 过 程 ， 材 料 将 由 熔 
融 状 态 进 入 非 娩 态 ， 这 个 过 程 被 称 为 RESET 过 程 。 综 上 所 述 可 以 看 出 PCM 写 “1” 和 写 “0” 是 不 对 称 的 ， 写 “1” 变 化 慢 ， 需 要 的 电流 小 ; 写 “0” 变 化 快 ， 
需要 的 电流 大 ， 如 图 11-2 所 示 (图 中 坐标 为 参考 值 ) 。 
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图 11-2 PCM 写 “0” 与 写 “1” 的 不 对 称 性 


由 于 PCM 特 性 优 恨 ， 是 未 来 最 有 可 能 取代 DRAM 的 非 易 失 存 储 器 之 一 ， 目 前 国内 外 已 有 许多 厂商 和 科研 机 构 进 行 了 相关 研究 ， 这 些 研究 可 分 为 以 下 几 
类 : @ 研 究 PCM 作 为 计算 机 系统 内 存 。 相 对 于 DRAM 而 言 ，PCM 写 延迟 约 高 10 倍 ， 但 它 具 有 非 易 失 性 ， 存 储 密度 和 功 耗 也 具有 一 定 优势 ， 这 使 得 它 可 以 在 需 
求 大 容量 、 低 功 耗 和 非 易 失 内 人 存 等 特性 的 应 用 场景 中 蔡 代 DRAM。@ 研 究 PCM 作 为 计算 机 系统 外 仔 。PCM 在 速度 、 寿 命 和 功 耗 上 均 超 过 了 Flash 技 术 ， 可 以 作 
为 外 人 存 使 用 ; 同时 PCM 工 艺 尺寸 较 低 ， 这 些 使 得 它 能 够 满足 海量 存储 系统 中 高 速率 、 低 功 耗 、 大 容量 的 需求 。@ 研 究 PCM 在 新 环境 下 的 存储 应 用 。 如 利用 
PCM 的 非 易 失 性 和 民 好 的 读 写 性 能 而 将 其 应 用 到 检查 点 (check point) 信息 、 数 据 库 应 用 环境 中 的 数据 恢复 等 。 


11.3 全息 存 储 技 术 


全 息 存储 技术 是 依据 全 息 学 的 原理 ， 将 信息 以 全 息 照 相 的 方式 保存 起 来 ， 它 不 但 把 物体 光 的 强度 (普通 照相 ) 分 布 记录 下 来 ， 而 且 把 物体 光 的 位 相 分 布 也 
完整 地 记录 下 来 ， 即 记录 了 物体 光 的 全 部 信息 。 全 息 技术 是 英国 科学 家 Gabor 在 1948 年 提出 来 的 ， 与 此 同时 全 息 存储 技术 引起 了 广泛 的 注意 。20 世 纪 80 年 
代 ， 光 学 计算 机 研究 的 热潮 再 次 推动 了 全 息 存储 技术 的 发 展 。 特 别 是 由 于 体 全 息 存储 材料 的 研发 、 光 电 技 术 取 得 的 重大 进展 、 小 型 固体 激光 器 、 高 分 辨 率 空间 
光 调 制 器 组 页 器 件 (SLM) 和 高 分 辩 率 高 速 光 电 探 测 器 阵列 (CCD) 等 周边 技术 日 趋 成 熟 ， 具 有 高 密度 、 高 传输 速率 和 足够 保 真 度 的 全 息 存 储 技术 逐步 接近 实 
用 化 阶段 。 


全 息 存 储 的 特点 如 下 : 
1. 高 存储 容量 


全 息 存 储 容量 的 上 限 为 1 /入 3 ， 理论 上 全 息 存储 密度 可 达 1 Tb/cm3 ( 1 Tb= 1 000Gb) 7 目 前 的 技术 已 达 1 0G b/cm3, 高 存储 密度 是 通过 在 感光 材料 的 同一 区 
域 记录 多 张 全 息 图 得 到 的 。 目 前 ， 最 常用 的 多 重 记录 方法 有 多 波长 、 多 角度 、 多 相位 记录 。 为 了 得 到 更 高 的 存储 密度 ， 可 以 将 几 种 多 重 记录 方法 综合 使 用 。 


2. 高 数据 传输 速率 和 快速 存 取 


全 息 图 采用 整 页 存储 和 读 出 的 方式 ,一 页 中 的 所 有 信息 位 都 被 并 行 地 记录 和 读 出 。 此 外 ， 全 息 数 据 库 可 以 用 无 惯性 的 光束 偏转 (如 声 光 偏转 器 ) 或 波长 选 
择 等 手段 来 寻 址 ， 不 一 定 要 用 磁盘 和 光盘 存储 中 必需 的 机 电 式 读 写 头 ， 因 而 数据 传输 速率 和 存 取 速 率 可 以 很 高 。 


3. 见 余 度 高 


与 按 位 存储 的 磁盘 和 光盘 不 同 ， 全 息 图 以 分 布 式 的 方式 存储 信息 ， 每 一 信息 位 都 仓储 在 全 息 图 的 整个 表面 上 或 整个 体积 中 ， 故 记录 介质 局 部 的 缺陷 和 损伤 
不 会 引起 信息 的 丢失 。 


全 息 存 储 器 能 够 直接 输出 数据 页 或 图 像 的 光学 重 构 信息 ， 因 此 可 以 并 行 地 进行 面向 页 面 的 检索 和 识别 ， 具 有 快速 的 内 容 相 关 寻 址 功能 。 这 种 独特 的 性 能 5 
以 用 来 构建 内 容 寻 址 存储 器 。 


相信 随 着 科技 的 不 断 进步 ， 会 有 更 多 优秀 的 复 用 技术 得 到 开发 和 应 用 ， 从 而 可 以 更 加 充分 地 发 掘 全 息 光 存储 的 存储 潜力 ， 实 现 大 容量 、 高 密度 的 数字 丰 


储 。 
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